图像处理方向的问题总结

一、历史回顾

我从事图像处理工作二十多年，至始至终有一个感觉，就是手段总是觉得不足，速速扩展数学理论，但是发现数学理论也不足以应对各种问题的局面变化。神经网络深度学习也存在各种各样的短板，最本质的问题都不是神经网络所能揭示的。因而本篇将记录存在的诸多问题和未来研究。

二、诸多问题的描述

在应用范围中，存在诸多需求，这些需求并不古怪或极端，而是我们常识范围的一般需求。

2.1 从像素到几何

在图像中，需要从像素中提取几何对象，这种算法似乎没有成型固定算法支持，其可研究的要素在于，像素的处理方法趋于统计算法，而对象的描述是几何的，如何从中产生一个过度，这是一个需要继续研究的要点，这无疑是个前缘问题。

2.2 几何对象之间的描述

对象与对象之间存在几何的差异性，如何去描述这种差异性，需要找到特征表述，比如，如何表述一个坦克和卡车的特征区分，动物如斑马和熊的特征区别，这是一个很难的技术课题。当然，用深度学习似乎能够鉴别，但是，训练过程本质是一个穷举过程，不能形成广泛的，更普遍的技术手段，一句话，能通过自学习，而不是训练，少量案例，而不是大量的数据集，要第一眼就能解释特征，这种技术似乎目前还没有。

2.3 纹理和纹理的比较

纹理和纹理的比较示例也是一个巨大问题，比如木材和布料材质不同，纹理不同，如何给出稳定的算法，说出它们存在的特征是什么，这个问题不是一般几何问题，也不是单纯像素问题，揭示它们深层次的特征区别，似乎不那么容易。

2.4 图像扭曲

从人类视觉上看，尽管图像是扭曲的，也能识别出图像中内容的本质，比如，将熊猫画在平面上，固然可以识别是熊喵，然而或画在橡胶上，然后任意拉伸橡胶，扭曲图像，从人类的眼光，能够识别出熊猫，而这种识别真正的机理是什么，如果能部分参透这种本质，设计的算法一定是高级的。

三、未来研究

从我的角度，未来研究方向是：

3.1 基础特征研究

就是从更广泛的数学理论中，发现能够针对现实问题。其中包括半神经网络和半基础数学模型的结合思路。

3.2 研究生成模型

我们知道，生成模型是通过广泛的同特征数据集上，用深度学习进行编码，然后用自创的编码，进行生成，这种方法很有扩展空间，值得研究。

3.3 自学习模型

自学习模型很有研究的必要，其深层的技术背景是蒙特卡洛算法，这是一种计算机可取的方法，结合这种思路去创造一些好的模型。

四、小结

本文概略地发表一些我对图像处理的看法，和相关的研究方法，但是不是全部，更全面的图像处理技术将在今后的文章中发布。