上位机图像处理和嵌入式模块部署(开篇)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing @163.com】

图像处理是现实生活当中很实用的一门技术。工业上一般采用的是机器视觉,以传统算法和光源控制为主,部分采用了深度学习技术。而生活当中,则主要以二维码识别、人脸识别、车牌识别和ocr识别为主,这中间深度学习与AI扮演了很重要的角色。过去,市场上的商业收费软件,主要还是以传统设备厂商提供的上位机软件为主,那这一部分是不是结合最新的npu技术,应该做出一些新的东西出来呢?

1、工业图像处理技术

如果是工业图像技术,这部分基本上还是传统的数字图像处理技术为主。有能力的厂家可以自己利用opencv写一些程序,如果自身缺少这方面的研发基础,一般都是采用国外的上位机软件或者是海康这样的大厂软件。虽然使用比较方便,但是技术上面受制于人也是一个客观事实。

2、国内纯上位机软件的不足

本来开发纯上位机软件,适配不同厂家的光源控制器、camera,这是很不错的选择。但是囿于客观的现实情况,不管多好的软件,在国内都很容易面临到被侵权的风险。所以,从理论上可行的方案,放在实际中未必那么ok。

3、QT方案的可行性

QT软件本身支持多平台,不管是windows,还是linux都有很好的适配,算得上是比较理想的platform。另外现在opencv发展也是越来越成熟,对于经典的算法,一般在opencv上面都可以找到对应的实现。所以说,如果希望自己开发一套使用的算法,QT+opencv是比较务实的一个选择。

4、自己需要解决的问题

图像处理,大部分同学都把精力放到了纯算法上面。但是如何配合算法,找到好的图像,这也是很重要的一个工作。比如光源的控制、比如光源的选择,再比如结果出来后,对plc或者嵌入式设备的控制等等,这部分都需要自己来解决。

5、新嵌入式技术的引入

目前来说,个人觉得比较理想的商业方式,还是QT+opencv做上层图像的仿真、验证和标定。这部分用python+opencv都是可以的。但是控制和光源一旦敲定之后,最好还是把相关标定数据port到嵌入式模块上面,由嵌入式模块以及上面的算法来继续负责剩下来的工作,这是比较务实且可行的一套做法。况且,现在嵌入式设备处理器的频率越来越高,甚至带有npu等加速硬件,这也为这样的商业方式提供了一种可能性。

6、新传感器和新场景的引入

所谓的新传感器,其实就是3d camera、2d lidar、 3d lidar等等。广义上来说,lidar也可以看成是一个图像,只不过这个图像比较稀疏而已,图像的分辨率没有那么高。但是他们的底层算法逻辑都是一样的。所以,大家学习或者开发的时候,不要把目光仅仅放在图像上面,而是应该把精力放在解决问题上面,比如我的图像处理技术或者是图像方案能够解决什么问题。并且说,在没有明显提高成本的同时,效果可以实现数量级的跨越,这是我们努力的方向和最终希望达到的目标。

当然技术的发展,也会让之前无法完成的一些功能,从不可能变成了可能,这方面的应用场景一定要留意和关注一下。

相关推荐
冬奇Lab几秒前
每日一个开源项目(第149篇):RAG-Anything - 把图片、表格、公式当成一等公民的多模态 RAG 框架
人工智能·开源
米小虾20 分钟前
AI Agent 安全实战指南:当智能体开始"不听话",开发者该如何应对?
人工智能·安全·agent
IT_陈寒2 小时前
Vite的热更新突然不香了,排查三小时差点砸键盘
前端·人工智能·后端
阿里云大数据AI技术4 小时前
构建高转化海外电商搜索:阿里云OpenSearch行业算法版的全链路智能优化策略实战
人工智能·搜索引擎
Awu12274 小时前
⚡从零开发 Agent CLI(五)实现一个可治理、可扩展的工具系统
前端·人工智能·claude
字节跳动视频云技术团队4 小时前
让 Agent 成为音视频工作台:AI MediaKit CLI + Skill 发布
人工智能·音视频开发
魏祖潇4 小时前
framework 整合实战——DDD/TDD/SDD 三件套在 framework 仓的真实落地
人工智能·后端
Token炼金师5 小时前
去噪扩散:从随机噪声到高保真图像的数学之路
人工智能·aigc
这个DBA有点耶5 小时前
AI写的SQL跑崩了生产库,这锅谁背?
数据库·人工智能·程序员