实际上,图像识别尤其是人脸识别的商业应用已经比较成熟了,尤其是静态图像的识别技术,其准确率已经很高了。然而,在自动驾驶的实际场景中,除了动态的图像识别技术,还要求对路况以及物体运动估计的预判等等,相比图像识别有更大的挑战和难度。另外,医疗影像方向近年来也被深度学习以及计算机视觉的热门带动,成为学术以及产业界有很大发展潜力的一个方向。
图像处理(Image Processing)

侧重于图像像素级别的处理,通常的处理手段是将工业相机、摄像机以及扫描仪等设备经过拍摄的图像存储在一个大的二维数组中,该数组中的元素称谓像素,其值为灰度值。
图像处理技术一般包括图像压缩,增强和复原,匹配、描述和识别3个部分。在深度学习以及 GPU 广泛应用之前的一段时间,图像处理中的核心算法是提出有效的二维结构描述符,通过描述符的不同来提取图像中不同的特征,如 2D 傅里叶描述符,2D Zernike 描述符等等。而深度学习则避免了描述符创造这一最为艰难的过程,直接利用最原始的二维数组对图像进行特征识别。
因此,深度学习大大加速了图像处理研究的发展。目前,基于深度学习的图像处理是计算机视觉中一大热点。