| 申请号 | CN202310942633.3 |
| 公开号(公开) | CN116777899A |
| 申请日 | 申请日 2023.07.28 |
| 申请人(公开) | 超音速人工智能科技股份有限公司(833753) |
| 发明人(公开) | 张俊峰(总); 沈俊羽; 杨培文; 张小村 |
原文摘要
本发明公开了一种基于回归模型的工业图像关键点检测方法、系统及平台,本发明通过方法获取与工业图像关键点相对应的图像数据,并结合特征提取网络,实时生成与工业图像关键点相对应的特征图;通过卷积处理实时压缩所述特征图的特征信息,其中,所述卷积为1×1卷积;构建回归模型,并结合回归模型,实时生成与工业图像关键点相对应的检测数据,以及与所述方法相应的系统、平台以及存储介质;可以保留特征的全局空间信息,提高关键点预测的空间泛化性和稳定性。而且会可以实现关键点回归模型添加每个点的可见性功能。
AI摘要
问题: 传统方法空间信息丢失、过检率高、训练状态不直观。
方案核心:
结构创新: 提出FCNeck结构(1×1卷积+展平)替代全局池化,保留空间信息。
功能创新: 在回归模型中增加关键点"可见性"预测功能,通过额外标志位判断关键点是否存在,降低过检率。
训练创新: 使用复合损失函数(均方误差+交叉熵+残差似然估计),提升精度并使训练过程更稳定、直观。
效果: 提升了工业图像关键点检测的准确性、稳定性和实用性。
我的理解
本发明提供了一种基于回归模型的工业图像关键点检测方法,所述的方法包括如下步骤:
一、获取与工业图像关键点相对应的图像数据,并结合特征提取网络,实时生成与工业图像关键点相对应的特征图;
二、通过卷积处理实时压缩所述特征图的特征信息,其中,所述卷积为1×1卷积;
a、卷积压缩所述特征图的特征信息,生成与特征图相对应的具有通道数的特征图;
b、归一化处理所述具有通道数的特征图,并激活Relu激活函数,以及展平处理所述特征图的特征。
所述通过卷积处理实时压缩所述特征图的特征信息,其中,所述卷积为1×1卷积,还包括:
c、判定是否存在不可见的关键点,若存在,则结合关键点阈值,去除不可见的关键点;否则,执行下一步骤;
d、根据判定结果数据,实时生成与特征图相对应的关键点信息。
三、构建回归模型,并结合回归模型,实时生成与工业图像关键点相对应的检测数据。
a、实时获取与特征图相对应的关键点信息;并对所述关键点信息于全连接层的输出层数量加二处理;
b、生成带有至少两个标志位数据的关键点,其中,一个标志位表示关键点存在,第二个表示不存在;
c、对标志位的值进行softmax归一化处理,并生成与关键点相对应的索引。
所述构建回归模型,并结合回归模型,实时生成与工业图像关键点相对应的检测数据,还包括:
d、生成与关键点相对应的位置数据,以及关键点存在与否的数据信息。
所述构建回归模型,并结合回归模型,实时生成与工业图像关键点相对应的检测数据,还包括:
e、结合均方误差损失函数数据,实时生成模型预测值和真实值之间像素差的平方和数据;
f、根据损失函数值数据,判断回归模型于训练过程中的收敛状态。
所需硬件
工控机(工业电脑)、工业相机(摄像头)、光源。

扩展阅读
| 我想对大家说的话 |
|---|
| 工作中遇到的问题,可以按类别查阅鄙人的算法文章,请点击《算法与数据汇总》。 |
| 学习算法:按章节学习《喜缺全书算法册》,大量的题目和测试用例,打包下载。重视操作 |
| 有效学习:明确的目标 及时的反馈 拉伸区(难度合适) 专注 |
| 员工说:技术至上,老板不信;投资人的代表说:技术至上,老板会信。 |
| 闻缺陷则喜(喜缺)是一个美好的愿望,早发现问题,早修改问题,给老板节约钱。 |
| 子墨子言之:事无终始,无务多业。也就是我们常说的专业的人做专业的事。 |
| 如果程序是一条龙,那算法就是他的是睛 |
| 失败+反思=成功 成功+反思=成功 |
视频课程
先学简单的课程,请移步CSDN学院,听白银讲师(也就是鄙人)的讲解。
https://edu.csdn.net/course/detail/38771
如何你想快速形成战斗了,为老板分忧,请学习C#入职培训、C++入职培训等课程
https://edu.csdn.net/lecturer/6176
测试环境
操作系统:win7 开发环境: VS2019 C++17
或者 操作系统:win10 开发环境: VS2022 C++17
如无特殊说明,本算法 用**C++**实现。
