机器视觉中图像检测和图像分割有何区别？-新闻资讯-微大智能科技（苏州）有限公司

登录注册

设为首页收藏本站

微大智能科技（苏州）有限公司

首页 >新闻资讯

机器视觉中图像检测和图像分割有何区别？

机器视觉系统对图形的处理可以分为目标检测（Object Detection）和图像分割（Image Segmentation），这2种方法有什么区别呢？

目标检测-预测包围盒

当我们说到物体检测时，我们通常会说到边界盒。这意味着我们的图像处理将在我们的图片中识别每个人周围的矩形。

边框通常由左上角的位置（2 个坐标）和宽度和高度（以像素为单位）定义。

来自开放图像数据集的注释图像。家庭堆雪人，来自 mwvchamber。在CC BY 2.0 许可下使用的图像。

如何理解目标检测

如果我们回到任务：识别图片上的所有人，则可以理解通过边界框进行对象检测的逻辑。

我们首先想到的解决方案是将图像切成小块，然后在每个子图像上应用图像分类，以区别该图像是否是人类。对单个图像进行分类是一项较容易的任务，并且是对象检测的一项，因此，他们采用了这种分步方法。

当前，YOLO模型（You Only Look Once）是解决此问题的伟大发明。YOLO模型的开发人员已经构建了一个神经网络，该神经网络能够立即执行整个边界框方法！

当前用于目标检测的模型：YOLO、Faster RCNN。

目标分割-预测掩模

一步一步地扫描图像的逻辑替代方法是远离画框，而是逐像素地注释图像。

如果你这样做，你将会有一个更详细的模型，它基本上是输入图像的一个转换。

来自开放图像数据集的注释图像。家庭堆雪人，来自 mwvchamber。在CC BY 2.0 许可下使用的图像。

如何理解图像分割

这个想法很基本：即使在扫描产品上的条形码时，也可以应用一种算法来转换输入信息（通过应用各种过滤器），这样，除了条形码序列以外的所有信息在终图像中都不可见。

这是在图像上定位条形码的基本方法，但与在图像分割中所发生的情况类似。

图像分割的返回格式称为掩码:与原始图像大小相同的图像，但是对于每个像素，它只有一个布尔值来指示对象是否存在。

如果我们允许多个类别，它就会变得更加复杂：例如，它可以将一个海滩景观分为三类：空气、海洋和沙子。

当下图像分割的模型：Mask RCNN、Unet、Segnet。

比较总结

对象检测：

输入是一个矩阵(输入图像)，每个像素有 3 个值(红、绿、蓝)，如果是黑色和白色，则每个像素有 1 个值；

输出是由左上角和大小定义的边框列表。

图像分割

输入是一个矩阵(输入图像)，每个像素有 3 个值(红、绿、蓝)，如果是黑色和白色，则每个像素有 1 个值。

输出是一个矩阵(掩模图像)，每个像素有一个包含指定类别的值。

×客服

×电话

海康相机

视觉软件

追光者光源

光谱共焦传感器

读码器

安全门锁

视觉检测设备

机器视觉中图像检测和图像分割有何区别？