数据标注教程:定义、工具、数据集

时间:2023-01-06 17:28:59

作者:景联文科技

浏览:

数据是所有机器学习和深度学习算法的组成部分。

正是它驱动这些复杂而精密的算法提供最先进的性能。

然而-

如果您想构建真正可靠的 AI 模型,您必须为算法提供正确结构化和标记的数据。

这就是数据标注过程发挥作用的地方。

您需要标注数据,以便机器学习系统可以使用它来学习如何执行给定的任务。

数据标注很简单,但可能并不容易

以下是我们将介绍的内容:

1.什么是数据标注?

2.数据标注的类型

3.自动数据标注与人工标注


1.什么是数据标注?

数据标注是对文本、图像和视频等各种格式的数据进行标记或识别的任务。

从本质上讲,它归结为标记感兴趣的区域或区域——这种类型的标注专门在图像和视频中找到。另一方面,标注文本数据主要包括添加相关信息,例如元数据,并将它们分配给某个类。

在机器学习中,数据标注的任务通常属于监督学习的范畴,其中学习算法将输入与相应的输出关联起来,并优化自身以减少错误。


2.数据标注的类型

以下是各种类型的数据标注及其特点。

2.1 图片标注

图像标注是用标签标注图像的任务。它确保机器学习算法将带标注的区域识别为给定图像中的不同对象或类别。

它涉及创建边界框(用于对象检测)和分割掩码(用于语义和实例分割)以区分不同类别的对象。您还可以使用关键点、3D 长方体、折线、关键点骨架和画笔等工具对图像进行标注。

图像标注通常用于为学习算法创建训练数据集。


然后将这些数据集用于构建支持 AI 的系统,例如自动驾驶汽车、皮肤癌检测工具或评估损坏和检查工业设备的无人机。

退房AI在医疗保健和AI保险更多地了解这些行业的AI应用。

现在,让我们探索和了解不同类型的图像标注方法。

 



2.2 边界框

边界框涉及围绕给定图像中的某个对象绘制一个矩形。边界框的边缘应该接触标记对象的最外层像素。

阅读使用边界框进行标注:质量最佳实践以了解更多信息。


2.3 3D 长方体

3D 长方体标注类似于边界框标注,但除了在对象周围绘制 2D 框外,用户还必须考虑深度因素。它可用于标注平面上需要导航的对象,例如汽车或飞机,或需要机器人抓取的对象。


2.4 多边形

在创建 3D 长方体或边界框时,您可能会注意到,标注区域中可能会无意中包含各种对象。这种情况远非理想,因为机器学习模型可能会混淆,从而对这些对象进行错误分类。

幸运的是,有办法避免这种情况,这就是多边形派上用场的地方。使它们如此有效的原因在于它们能够在像素级别围绕所需对象创建蒙版。


2.5 多边形工具

您可以选择该工具,然后简单地开始在图像中的对象周围绘制由单个点组成的线。线条不需要完美,因为一旦起点和终点在对象周围连接,您可以向带标注的对象添加标签。


3.开始标注数据

关键点工具

关键点标注是另一种通过一系列点或点集合来标注对象的方法。

这种类型的方法在手势检测、面部标志检测和运动跟踪中非常有用。关键点可以单独使用,也可以组合使用以形成定义对象姿势的点图。


关键点骨架工具

它用于定义多肢物体的 2D 或 3D 姿势。关键点骨架具有一组定义的点,可以移动这些点以适应对象的外观。

您可以使用关键点标注来训练机器学习模型来模仿人体姿势,然后针对特定任务的应用程序(例如支持 AI 的机器人)推断其功能。



折线工具

折线工具允许用户创建一系列连接线。

您也可以通过在感兴趣的对象周围单击来创建一个点来使用它。每个点将通过将当前点与前一个点连接来创建一条线。它可用于标注道路、车道标记、交通标志等。


语义分割

语义分割是将给定图像中对象的相似部分或像素组合在一起的任务。使用这种方法标注数据可以让机器学习算法学习和理解特定的特征,并且可以帮助它对异常进行分类。

语义分割在医学领域非常有用,放射科医生在 X 射线、MRI 和 CT 扫描中使用它来识别感兴趣的区域。这是胸部 X 射线标注的示例。


视频标注

与图像标注类似,视频标注是对视频中的片段或片段进行标记以逐帧分类、检测或识别所需对象的任务。

视频标注使用与图像标注相同的技术,如边界框或语义分割,但以逐帧为基础。它是计算机视觉任务(例如定位和对象跟踪)的基本技术。


文字标注

数据标注在与自然语言处理 (NLP) 相关的任务中也是必不可少的。

文本标注是指通过添加标签或元数据来添加语言数据的相关信息。为了更直观地理解文本标注,让我们考虑两个示例。

1. 分配标签

添加标签意味着为句子分配一个描述其类型的词。它可以用情感、技术性等来描述。例如,可以给“我对这个产品感到满意,它很棒”这句话赋予“快乐”这样的标签。

2. 添加元数据

类似地,在“Id like to order a pizza today”这句话中,可以为学习算法添加相关信息,以便它可以优先并专注于某些词。例如,可以添加诸如“今晚(时间)我想订购披萨(food_item)”之类的信息。

现在,让我们简要探讨各种类型的文本标注。


情感注解

情绪标注只不过是分配代表人类情绪的标签,例如悲伤、快乐、愤怒、积极、消极、中性等。 )


意图标注

意图标注也为句子分配标签,但它侧重于句子背后的意图或愿望。例如,在客户服务场景中,“我需要和Sam通话”之类的消息可以将呼叫路由到 Sam 单独,或者“我对信用卡有疑问”之类的消息可以将呼叫路由到团队处理信用卡问题。


命名实体标注 (NER)

命名实体识别 (NER) 旨在检测和分类句子中预定义的命名实体或特殊表达式。

它用于根据单词的含义搜索单词,例如人名、位置等。 NER 在提取信息以及对它们进行分类和分类方面很有用。


语义标注

正如我们之前看到的那样,语义标注将元数据、附加信息或标签添加到涉及概念和实体(例如人物、地点或主题)的文本中。

自动数据标注与人工标注。


随着时间的流逝,人工标注者会感到疲倦且注意力不集中,这通常会导致性能不佳和错误。数据标注是一项需要全神贯注和熟练人员的任务,而手动标注使该过程既 费时又费钱。

这就是领先的 ML 团队押注自动化数据标记的原因。

但是,在模型未能正确标记的情况下,人类可以干预、审查和纠正错误标记的数据。然后可以使用更正和审查的数据再次训练标记模型。

自动数据标记可以为您节省大量金钱和时间,但可能缺乏准确性。相比之下,人工标注的成本可能要高得多,但往往更准确。


做AI行业客户的数据参谋