首页 首页 公司资讯 奇妙彩票官网

让建站和SEO变得简单

让不懂建站的用户快速建站,让会建站的提高建站效率!

公司资讯

你的位置:奇妙彩票 > 公司资讯 > 什么是数据增强?

什么是数据增强?

发布日期:2022-03-13 20:50    点击次数:118

要是有填塞的观察数据,机器学习模子不错进展出色。糟糕的是,关于很多应用才略来说,对高质地数据的探望仍然是一个狡饰。

科罚这个问题的一个步伐是“数据增强”,这是一种从现存的观察样本中生成新的观察样本的期间。数据增强是一种在数据不停环境下提升机器学习模子性能和准确性的低本钱和灵验的步伐。

机器学习模子的“过度拟合”

当机器学习模子在有限的例子上进行观察时,它们不竭会“过度拟合”。当机器学习模子对其观察示例扩张准确,但不可扩张到未见数据时,就会发生“过度拟合”。

在机器学习中有几种步伐不错幸免“过度拟合”,比如遴选不同的算法、修改模子的结构和诊治参数。但最终,科罚“过度拟合”的主要步伐是向观察数据集添加更多高质地数据。

举例,研讨卷积神经麇集(CNN),这是一种机器学习架构,荒谬合适于图像分类任务。要是莫得多量种种的观察例子,CNN最终会在本质全国中对图像进行诞妄分类。另一方面,要是CNN汲取不同角度和不同光照条款下的物体图像观察,它在本质全国中识别物体的技艺会变得愈加宏大。

关系词,网罗独特的培训示例可能是崇高的、耗时的,无意以致是不可能的。这一挑战在监督学习应用才略中变得愈加穷困,因为观察示必然须由人类巨匠标志。

数据加多

加多观察数据集种种性的步伐之一是创建现存数据的副本,并对其进行小的修改。这被称为“数据增强”。

举例,假定在图像分类数据麇集有20张鸭子的图像。通过创建鸭子图像的副本并水平翻转它们,您仍是将“鸭子”类的观察示例加多了一倍。您不错使用其他相易,如旋转、剪切、缩放和相易。您还不错衔尾这些相易来进一步扩展独到的观察示例联贯。

数据引申不需要局限于几何操作。添加噪点、转变方法成就和其他后果(如迁延和锐化滤镜)也不错匡助将现存的观察示例算作新的数据。

数据引申的例子

数据增强关于监督学习荒谬有用,因为您仍是有了标签,不需要独特的职责来细巧新的示例。数据增强关于其他类型的机器学习算法也很有用,如无监督学习、对比学习和生成模子。

数据增强仍是成为观察野心理视觉应用的机器学习模子的圭臬实践。流行的机器学习和深度学习编程库具有易于使用的函数,不错将数据增强集成到机器学习观察护道中。

数据增强不仅局限于图像,还不错应用于其他类型的数据。关于文本数据集,不错用它们的同义词替换名词和动词。在音频数据中,不错通过添加噪声或转变播放速率来修改观察示例。

数据引申的摒弃

数据增强并不是科罚所稀有据问题的灵丹灵药。您不错将其视为机器学习模子的免费性能增强器。基于您的主见应用才略,您仍然需要具有填塞示例的荒谬大的观察数据集。

在某些应用才略中,观察数据可能太过有限,无法通过数据引申来提供匡助。在这些情况下,必须网罗更多的数据,直到达到最小阈值,才能使用数据增强。无意,您不错使用迁徙学习,即您在一个通用数据集(举例ImageNet)上观察机器学习模子,然后通过微调其针对主见应用才略的有限数据的更高级次来从头期骗它。

数据增强也不可科罚其他问题,比如观察数据麇集存在的偏差。数据引申经过还需要进行诊治,以科罚其他潜在的问题,举例类不服衡。

要是使用稳妥,数据料理不错成为机器学习工程师用具箱中的一个宏大用具。

 

 



上一篇:没有了

下一篇:恒大深圳摘牌,恒驰下线