【超音速专利 CN116777899A】基于回归模型的工业图像关键点检测方法、系统及平台


申请号	CN202310942633.3
公开号（公开）	CN116777899A
申请日	申请日 2023.07.28
申请人（公开）	超音速人工智能科技股份有限公司(833753)
发明人（公开）	张俊峰（总); 沈俊羽; 杨培文; 张小村

原文摘要

本发明公开了一种基于回归模型的工业图像关键点检测方法、系统及平台，本发明通过方法获取与工业图像关键点相对应的图像数据，并结合特征提取网络，实时生成与工业图像关键点相对应的特征图；通过卷积处理实时压缩所述特征图的特征信息，其中，所述卷积为1×1卷积；构建回归模型，并结合回归模型，实时生成与工业图像关键点相对应的检测数据，以及与所述方法相应的系统、平台以及存储介质；可以保留特征的全局空间信息，提高关键点预测的空间泛化性和稳定性。而且会可以实现关键点回归模型添加每个点的可见性功能。

AI摘要

问题：传统方法空间信息丢失、过检率高、训练状态不直观。

方案核心：

结构创新：提出FCNeck结构（1×1卷积+展平）替代全局池化，保留空间信息。

功能创新：在回归模型中增加关键点"可见性"预测功能，通过额外标志位判断关键点是否存在，降低过检率。

训练创新：使用复合损失函数（均方误差+交叉熵+残差似然估计），提升精度并使训练过程更稳定、直观。

效果：提升了工业图像关键点检测的准确性、稳定性和实用性。

我的理解

本发明提供了一种基于回归模型的工业图像关键点检测方法，所述的方法包括如下步骤：

一、获取与工业图像关键点相对应的图像数据，并结合特征提取网络，实时生成与工业图像关键点相对应的特征图；

二、通过卷积处理实时压缩所述特征图的特征信息，其中，所述卷积为1×1卷积；

a、卷积压缩所述特征图的特征信息，生成与特征图相对应的具有通道数的特征图；

b、归一化处理所述具有通道数的特征图，并激活Relu激活函数，以及展平处理所述特征图的特征。

所述通过卷积处理实时压缩所述特征图的特征信息，其中，所述卷积为1×1卷积，还包括：

c、判定是否存在不可见的关键点，若存在，则结合关键点阈值，去除不可见的关键点；否则，执行下一步骤；

d、根据判定结果数据，实时生成与特征图相对应的关键点信息。

三、构建回归模型，并结合回归模型，实时生成与工业图像关键点相对应的检测数据。

a、实时获取与特征图相对应的关键点信息；并对所述关键点信息于全连接层的输出层数量加二处理；

b、生成带有至少两个标志位数据的关键点，其中，一个标志位表示关键点存在，第二个表示不存在；

c、对标志位的值进行softmax归一化处理，并生成与关键点相对应的索引。

所述构建回归模型，并结合回归模型，实时生成与工业图像关键点相对应的检测数据，还包括：

d、生成与关键点相对应的位置数据，以及关键点存在与否的数据信息。

所述构建回归模型，并结合回归模型，实时生成与工业图像关键点相对应的检测数据，还包括：

e、结合均方误差损失函数数据，实时生成模型预测值和真实值之间像素差的平方和数据；

f、根据损失函数值数据，判断回归模型于训练过程中的收敛状态。

所需硬件

工控机（工业电脑）、工业相机（摄像头）、光源。

扩展阅读

我想对大家说的话
工作中遇到的问题，可以按类别查阅鄙人的算法文章，请点击《算法与数据汇总》。
学习算法：按章节学习《喜缺全书算法册》，大量的题目和测试用例，打包下载。重视操作
有效学习：明确的目标及时的反馈拉伸区（难度合适）专注
员工说：技术至上，老板不信；投资人的代表说：技术至上，老板会信。
闻缺陷则喜(喜缺)是一个美好的愿望，早发现问题，早修改问题，给老板节约钱。
子墨子言之：事无终始，无务多业。也就是我们常说的专业的人做专业的事。
如果程序是一条龙，那算法就是他的是睛
失败+反思=成功成功+反思=成功

视频课程

先学简单的课程，请移步CSDN学院，听白银讲师（也就是鄙人）的讲解。
https://edu.csdn.net/course/detail/38771

如何你想快速形成战斗了，为老板分忧，请学习C#入职培训、C++入职培训等课程
https://edu.csdn.net/lecturer/6176

测试环境

操作系统：win7 开发环境： VS2019 C++17

或者操作系统：win10 开发环境： VS2022 C++17

如无特殊说明，本算法用**C++**实现。