目标检测终极指南

时间：2024-06-18 17:31:01

作者：景联文科技

浏览：次

计算机视觉是当前人工智能最热门的领域之一，而目标检测在其快速发展中发挥了关键作用。

什么是物体检测？

对象检测是计算机视觉领域，它处理图像或视频中包含的对象的定位和分类。

简而言之：对象检测归结为在检测到的对象周围绘制边界框，这使我们能够在给定场景中定位它们。

对象检测与图像分类

在继续之前，让我们澄清一下图像识别和物体检测之间的区别。

图像分类通过分类器（例如深度神经网络）发送整个图像，以便它吐出标签。分类器会考虑整个图像，但不会告诉您标签在图像中出现的位置。

对象检测稍微高级一些，因为它会在分类对象周围创建一个边界框。

分类有其优势——对于没有真正物理边界的标签（例如“模糊”或“晴天”）来说，这是一个更好的选择。然而，物体检测系统在发现确实存在物质的物体（例如汽车）方面几乎总是优于分类网络。

对象检测与图像分割

图像分割是定义在图像中找到对象类的哪些像素的过程。

语义图像分割将标注属于该标签的所有像素，但不会定义每个对象的边界。

相反，对象检测不会分割对象，而是会用一个框清楚地定义每个单独对象实例的位置。

将语义分割与对象检测相结合导致实例分割，它首先检测对象实例，然后在检测到的框内分割每个实例（在这种情况下称为感兴趣区域）。

被拉长的对象 - 使用实例分割。

检测到铅笔等长而细的物品时，其所占箱子面积不到10%。这使模型偏向于背景像素而不是对象本身。

没有物理存在的对象——使用分类

图像中的事物，例如“阳光”、“明亮”或“倾斜”等标签，最好通过图像分类技术来识别——让网络获取图像并找出与这些标签相关的特征。

不同角度没有明确边界的对象——使用语义分割

航拍图像中的天空、地面或植被实际上并没有明确的界限。语义分割在“绘制”属于这些类别的像素时更有效。物体检测仍然会选择“天空”作为物体，但它会更加努力地处理这些物体。

经常被遮挡的对象——尽可能使用实例分割

在两阶段检测网络中，遮挡的处理比一次性方法要好得多。在检测器的这个分支中，实例分割模型在理解和分割被遮挡对象方面将比单纯的边界框检测器做得更好。

物体检测的类型和模式

在 2013 年深度学习起飞之前，几乎所有的目标检测都是通过经典的机器学习技术完成的。

这些将检测图像中的许多共同特征，并使用逻辑回归、颜色直方图或随机森林对它们的集群进行分类。今天基于深度学习的技术大大优于这些技术。

物体检测应用

最后，让我们看看一些最常见的对象检测用例。

人脸检测

大多数人脸识别系统都是由物体检测驱动的。它可用于检测人脸、对情绪或表情进行分类，并将生成的框输入图像检索系统，以识别群体中的特定人。

人脸检测是最流行的对象检测用例之一，当您用人脸解锁手机时，您可能已经在使用它了。

人员检测也常用于计算零售店的人数或确保社交距离指标。

智能视频分析

对象检测可用于智能视频分析 (IVA)，只要零售场所有闭路电视摄像机，即可了解购物者如何与产品互动。这些视频流通过匿名管道来模糊人脸并对个人进行去识别化。一些 IVA 用例通过仅查看人的鞋子、将摄像头放置在膝盖以下并确保系统捕捉到人的存在来保护隐私，而无需直接查看他们的可识别特征。IVA 通常用于工厂、机场和交通枢纽，以跟踪排队长度和进入限制区域。