图像处理方向的问题总结

一、历史回顾

我从事图像处理工作二十多年,至始至终有一个感觉,就是手段总是觉得不足,速速扩展数学理论,但是发现数学理论也不足以应对各种问题的局面变化。神经网络深度学习也存在各种各样的短板,最本质的问题都不是神经网络所能揭示的。因而本篇将记录存在的诸多问题和未来研究。

二、诸多问题的描述

在应用范围中,存在诸多需求,这些需求并不古怪或极端,而是我们常识范围的一般需求。

2.1 从像素到几何

在图像中,需要从像素中提取几何对象,这种算法似乎没有成型固定算法支持,其可研究的要素在于,像素的处理方法趋于统计算法,而对象的描述是几何的,如何从中产生一个过度,这是一个需要继续研究的要点,这无疑是个前缘问题。

2.2 几何对象之间的描述

对象与对象之间存在几何的差异性,如何去描述这种差异性,需要找到特征表述,比如,如何表述一个坦克和卡车的特征区分,动物如斑马和熊的特征区别,这是一个很难的技术课题。当然,用深度学习似乎能够鉴别,但是,训练过程本质是一个穷举过程,不能形成广泛的,更普遍的技术手段,一句话,能通过自学习,而不是训练,少量案例,而不是大量的数据集,要第一眼就能解释特征,这种技术似乎目前还没有。

2.3 纹理和纹理的比较

纹理和纹理的比较示例也是一个巨大问题,比如木材和布料材质不同,纹理不同,如何给出稳定的算法,说出它们存在的特征是什么,这个问题不是一般几何问题,也不是单纯像素问题,揭示它们深层次的特征区别,似乎不那么容易。

2.4 图像扭曲

从人类视觉上看,尽管图像是扭曲的,也能识别出图像中内容的本质,比如,将熊猫画在平面上,固然可以识别是熊喵,然而或画在橡胶上,然后任意拉伸橡胶,扭曲图像,从人类的眼光,能够识别出熊猫,而这种识别真正的机理是什么,如果能部分参透这种本质,设计的算法一定是高级的。

三、未来研究

从我的角度,未来研究方向是:

3.1 基础特征研究

就是从更广泛的数学理论中,发现能够针对现实问题。其中包括半神经网络和半基础数学模型的结合思路。

3.2 研究生成模型

我们知道,生成模型是通过广泛的同特征数据集上,用深度学习进行编码,然后用自创的编码,进行生成,这种方法很有扩展空间,值得研究。

3.3 自学习模型

自学习模型很有研究的必要,其深层的技术背景是蒙特卡洛算法,这是一种计算机可取的方法,结合这种思路去创造一些好的模型。

四、小结

本文概略地发表一些我对图像处理的看法,和相关的研究方法,但是不是全部,更全面的图像处理技术将在今后的文章中发布。

相关推荐
测试员周周5 小时前
【Appium 系列】第16节-WebView-H5上下文切换 — 混合应用的自动化难点
运维·开发语言·人工智能·功能测试·appium·自动化·测试用例
K姐研究社7 小时前
怎么用AI制作电商口播视频,开拍APP一键生成
人工智能·音视频
LaughingZhu7 小时前
Product Hunt 每日热榜 | 2026-05-21
前端·人工智能·经验分享·chatgpt·html
传说故事8 小时前
【论文阅读】MotuBrain: An Advanced World Action Model for Robot Control
论文阅读·人工智能·具身智能·wam
北京耐用通信8 小时前
全域适配工业场景耐达讯自动化Modbus TCP 转 PROFIBUS 网关轻松实现以太网与现场总线互通
网络·人工智能·网络协议·自动化·信息与通信
火山引擎开发者社区8 小时前
TRAE × 火山引擎 Supabase:为你的 AI 应用装上“数据引擎”
人工智能
小a彤9 小时前
GE 在 CANN 五层架构中的位置
人工智能·深度学习·transformer
前端若水9 小时前
会话管理:创建、切换、删除对话历史
前端·人工智能·python·react.js
Upsy-Daisy9 小时前
AI Agent 项目学习笔记(八):Tool Calling 工具调用机制总览
人工智能·笔记·学习
企学宝9 小时前
企学宝5月专题课程丨《OpenClaw AI 智能体实战营:从零基础部署到全场景自动化落地》
人工智能·ai·企业培训