人工智能是一个概念性术语,涵盖了若干特定技术。本文中,我们将探讨机器视觉(MV)和计算机视觉(CV)。二者都涉及可视化输入的摄取和解释,因此,了解这些重叠技术的优势、约束和最佳应用场景非常重要。 早在20世纪50年代,研究人员就从用于统计模式识别的简单二维成像入手,开始开发计算机视觉技术。到了1978年,麻省理工学院人工智能实验室的研究人员开发了一种自下而上的方法,从二维计算机生成的"草图"中推断出三维模型,至此,计算机视觉的实际应用才变得显而易见。从那时起,图像识别技术就被划分为不同的类别。 计算机视觉和机器视觉均利用图像捕捉和分析,其执行任务的速度和精确度是人眼无法比拟的。有鉴于此,用这两种密切相关的技术的共性来描述二者,用它们的特定用例而不是它们之间的差异来区分二者,可能会更有成效。 计算机视觉和机器视觉系统的组件和要求大部分相同:
- 一种包含图像传感器和透镜的成像装置
- 可使用图像采集卡或帧捕获器(在一些使用现代接口的数码相机中,不需要帧捕获器)
- 适合应用的照明
- 通过计算机或内部系统处理图像的软件,如许多"智能"相机
那么二者的实际区别是什么呢?计算机视觉是指自动捕捉和处理图像,重点是图像分析。换言之,计算机视觉的目的不仅仅是看,而是要在观察的基础上处理和提供有用的结果。机器视觉是指计算机视觉在工业环境中的应用,是计算机视觉的一个分类。
计算机视觉应用
2019年,计算机视觉在许多行业发挥着越来越大的作用。在数字营销中,各公司纷纷开始使用图像识别技术来推动加强广告投放效果,推动提高业务转化。由于CV技术的准确性和效率不断提高,营销人员现在可以绕过传统的人口统计研究(考虑到数据隐私问题,这可能是个问题),快速、准确地梳理数以百万计的在线图像。然后,他们就能在适当的环境中有针对性的开展营销活动,只需人类所需的一小部分时间就可实现相同结果。 此外,最近的一项研究表明,在使用计算机视觉的营销机构中,有59%利用它来检测网上不安全的品牌内容。在一篇关于大肠杆菌爆发的文章旁边,却有一个客户的手工肉制品配送服务广告,这效果可谓一言难尽,对吧?在2019年消费电子峰会(CES)上展示的计算机视觉其他趋势应用场景包括:自动驾驶汽车应用、治安和安全性的实现等。
机器视觉与智慧工厂
对制造商而言,利用视觉识别产品缺陷和流程效率低下等问题是控制成本和提高客户满意度的关键。自上世纪90年代以来,机器视觉系统已经在世界各地数千家工厂安装,用以实现许多基本的质量保证和工作流的自动化。由于创新的云技术增强了数据共享能力,提高了准确性,制造业部署MV驱动系统的步伐也随之加快。2017年,北美地区机器视觉、机器人系统和部件的销售额创下历史新高,金融交易额同比增长14.6%,达到26.33亿美元。制造商开始认识到,机器视觉系统是实现质量、成本和速度目标的重要投资。
生产线上的机器视觉
检测缺陷并迅速消除造成缺陷的原因对任何制造流程都很重要。企业已经转向机器视觉解决方案,以主动应对缺陷的发生及缺陷的根本原因。通过在生产线上安装摄像头和训练机器学习模型以识别定义优良产品和劣质产品的复杂变量,可以实时识别缺陷并确定缺陷在制造流程中的发生位置,从而采取主动措施。
标注视觉技术的机器学习模型
为了实现计算机视觉或机器视觉目标,首先需要训练机器学习模型,使视觉系统"智能化"。要使机器学习模型更准确,就需要大量的标注数据,特别是需要针对要构建的解决方案。有一些公共使用的免费数据集可以很好地用于测试算法或执行简单的任务,但对于大多数实际项目而言,要想成功,就需要专门的数据集来确保它们包含正确的元数据。例如,在自动驾驶车辆中实施的计算机视觉模型就需要大量的图像标注来标记人、交通信号、汽车和其他对象。对于自动驾驶汽车而言,任何不够精确的数据都将会造成巨大的问题。 尽管CV和MV之间的界限已经模糊,但二者最好由各自的应用场景来定义。传统意义上,计算机视觉被用来实现图像处理的自动化,而机器视觉则是计算机视觉在工厂生产线等实际界面中的应用。