【超音速专利 CN116777899A】基于回归模型的工业图像关键点检测方法、系统及平台

申请号 CN202310942633.3
公开号(公开) CN116777899A
申请日 申请日 2023.07.28
申请人(公开) 超音速人工智能科技股份有限公司(833753)
发明人(公开) 张俊峰(总); 沈俊羽; 杨培文; 张小村

原文摘要

本发明公开了一种基于回归模型的工业图像关键点检测方法、系统及平台,本发明通过方法获取与工业图像关键点相对应的图像数据,并结合特征提取网络,实时生成与工业图像关键点相对应的特征图;通过卷积处理实时压缩所述特征图的特征信息,其中,所述卷积为1×1卷积;构建回归模型,并结合回归模型,实时生成与工业图像关键点相对应的检测数据,以及与所述方法相应的系统、平台以及存储介质;可以保留特征的全局空间信息,提高关键点预测的空间泛化性和稳定性。而且会可以实现关键点回归模型添加每个点的可见性功能。

AI摘要

问题: 传统方法空间信息丢失、过检率高、训练状态不直观。

方案核心:

结构创新: 提出FCNeck结构(1×1卷积+展平)替代全局池化,保留空间信息。

功能创新: 在回归模型中增加关键点"可见性"预测功能,通过额外标志位判断关键点是否存在,降低过检率。

训练创新: 使用复合损失函数(均方误差+交叉熵+残差似然估计),提升精度并使训练过程更稳定、直观。

效果: 提升了工业图像关键点检测的准确性、稳定性和实用性。

我的理解

本发明提供了一种基于回归模型的工业图像关键点检测方法,所述的方法包括如下步骤:

一、获取与工业图像关键点相对应的图像数据,并结合特征提取网络,实时生成与工业图像关键点相对应的特征图;

二、通过卷积处理实时压缩所述特征图的特征信息,其中,所述卷积为1×1卷积;

a、卷积压缩所述特征图的特征信息,生成与特征图相对应的具有通道数的特征图;

b、归一化处理所述具有通道数的特征图,并激活Relu激活函数,以及展平处理所述特征图的特征。

所述通过卷积处理实时压缩所述特征图的特征信息,其中,所述卷积为1×1卷积,还包括:

c、判定是否存在不可见的关键点,若存在,则结合关键点阈值,去除不可见的关键点;否则,执行下一步骤;

d、根据判定结果数据,实时生成与特征图相对应的关键点信息。

三、构建回归模型,并结合回归模型,实时生成与工业图像关键点相对应的检测数据。

a、实时获取与特征图相对应的关键点信息;并对所述关键点信息于全连接层的输出层数量加二处理;

b、生成带有至少两个标志位数据的关键点,其中,一个标志位表示关键点存在,第二个表示不存在;

c、对标志位的值进行softmax归一化处理,并生成与关键点相对应的索引。

所述构建回归模型,并结合回归模型,实时生成与工业图像关键点相对应的检测数据,还包括:

d、生成与关键点相对应的位置数据,以及关键点存在与否的数据信息。

所述构建回归模型,并结合回归模型,实时生成与工业图像关键点相对应的检测数据,还包括:

e、结合均方误差损失函数数据,实时生成模型预测值和真实值之间像素差的平方和数据;

f、根据损失函数值数据,判断回归模型于训练过程中的收敛状态。

所需硬件

工控机(工业电脑)、工业相机(摄像头)、光源。

扩展阅读

我想对大家说的话
工作中遇到的问题,可以按类别查阅鄙人的算法文章,请点击《算法与数据汇总》。
学习算法:按章节学习《喜缺全书算法册》,大量的题目和测试用例,打包下载。重视操作
有效学习:明确的目标 及时的反馈 拉伸区(难度合适) 专注
员工说:技术至上,老板不信;投资人的代表说:技术至上,老板会信。
闻缺陷则喜(喜缺)是一个美好的愿望,早发现问题,早修改问题,给老板节约钱。
子墨子言之:事无终始,无务多业。也就是我们常说的专业的人做专业的事。
如果程序是一条龙,那算法就是他的是睛
失败+反思=成功 成功+反思=成功

视频课程

先学简单的课程,请移步CSDN学院,听白银讲师(也就是鄙人)的讲解。
https://edu.csdn.net/course/detail/38771

如何你想快速形成战斗了,为老板分忧,请学习C#入职培训、C++入职培训等课程
https://edu.csdn.net/lecturer/6176

测试环境

操作系统:win7 开发环境: VS2019 C++17

或者 操作系统:win10 开发环境: VS2022 C++17

如无特殊说明,本算法 用**C++**实现。

相关推荐
万俟淋曦14 小时前
【TextIn大模型加速器 + 火山引擎】赋能机器人行业分析与VLA研究
人工智能·机器人·火山引擎·robot·具身智能·coze·textln
三掌柜66614 小时前
2025三掌柜赠书活动第四十六期 白话AI安全:32个故事带你读懂AI的攻防博弈
人工智能
猫头虎14 小时前
猫头虎AI分享|可把GitHub代码库变成实时文档中心的一款实用型MCP工具:GitMCP,让AI随时访问最新文档代码,消除代码幻觉
人工智能·github·aigc·ai编程·ai写作·agi·ai-native
IT_陈寒14 小时前
Java 21新特性实战:5个必学的性能优化技巧让你的应用提速40%
前端·人工智能·后端
小毅&Nora14 小时前
【人工智能】【阿里云百炼平台】 ① 大模型全景图:从文本到全模态,一张图看懂AI能力边界(2025版)
人工智能·阿里云·云计算
寻道码路14 小时前
【GitHub周榜】WrenAI:开源SQL AI代理,让Text-to-SQL轻松实现,开启自然语言与数据交互新时代
人工智能·sql·语言模型·开源·github·aigc·ai编程
技术小甜甜14 小时前
[AI] openwebui内网部署网页加载缓慢?一个设置绕过openai连接问题!
人工智能·llm·ollama·openwebui
编码小哥14 小时前
OpenCV轮廓特征分析:面积、周长与形状拟合
人工智能·opencv·计算机视觉
张彦峰ZYF14 小时前
AI赋能原则8解读思考:当 AI 能“完美决策”-为什么动态契约才是安全之钥
人工智能·ai·ai赋能与落地
白日做梦Q14 小时前
联邦学习与隐私保护深度学习:面向分布式场景的研究热点与实践
人工智能·分布式·深度学习