【超音速专利 CN116777899A】基于回归模型的工业图像关键点检测方法、系统及平台

申请号 CN202310942633.3
公开号(公开) CN116777899A
申请日 申请日 2023.07.28
申请人(公开) 超音速人工智能科技股份有限公司(833753)
发明人(公开) 张俊峰(总); 沈俊羽; 杨培文; 张小村

原文摘要

本发明公开了一种基于回归模型的工业图像关键点检测方法、系统及平台,本发明通过方法获取与工业图像关键点相对应的图像数据,并结合特征提取网络,实时生成与工业图像关键点相对应的特征图;通过卷积处理实时压缩所述特征图的特征信息,其中,所述卷积为1×1卷积;构建回归模型,并结合回归模型,实时生成与工业图像关键点相对应的检测数据,以及与所述方法相应的系统、平台以及存储介质;可以保留特征的全局空间信息,提高关键点预测的空间泛化性和稳定性。而且会可以实现关键点回归模型添加每个点的可见性功能。

AI摘要

问题: 传统方法空间信息丢失、过检率高、训练状态不直观。

方案核心:

结构创新: 提出FCNeck结构(1×1卷积+展平)替代全局池化,保留空间信息。

功能创新: 在回归模型中增加关键点"可见性"预测功能,通过额外标志位判断关键点是否存在,降低过检率。

训练创新: 使用复合损失函数(均方误差+交叉熵+残差似然估计),提升精度并使训练过程更稳定、直观。

效果: 提升了工业图像关键点检测的准确性、稳定性和实用性。

我的理解

本发明提供了一种基于回归模型的工业图像关键点检测方法,所述的方法包括如下步骤:

一、获取与工业图像关键点相对应的图像数据,并结合特征提取网络,实时生成与工业图像关键点相对应的特征图;

二、通过卷积处理实时压缩所述特征图的特征信息,其中,所述卷积为1×1卷积;

a、卷积压缩所述特征图的特征信息,生成与特征图相对应的具有通道数的特征图;

b、归一化处理所述具有通道数的特征图,并激活Relu激活函数,以及展平处理所述特征图的特征。

所述通过卷积处理实时压缩所述特征图的特征信息,其中,所述卷积为1×1卷积,还包括:

c、判定是否存在不可见的关键点,若存在,则结合关键点阈值,去除不可见的关键点;否则,执行下一步骤;

d、根据判定结果数据,实时生成与特征图相对应的关键点信息。

三、构建回归模型,并结合回归模型,实时生成与工业图像关键点相对应的检测数据。

a、实时获取与特征图相对应的关键点信息;并对所述关键点信息于全连接层的输出层数量加二处理;

b、生成带有至少两个标志位数据的关键点,其中,一个标志位表示关键点存在,第二个表示不存在;

c、对标志位的值进行softmax归一化处理,并生成与关键点相对应的索引。

所述构建回归模型,并结合回归模型,实时生成与工业图像关键点相对应的检测数据,还包括:

d、生成与关键点相对应的位置数据,以及关键点存在与否的数据信息。

所述构建回归模型,并结合回归模型,实时生成与工业图像关键点相对应的检测数据,还包括:

e、结合均方误差损失函数数据,实时生成模型预测值和真实值之间像素差的平方和数据;

f、根据损失函数值数据,判断回归模型于训练过程中的收敛状态。

所需硬件

工控机(工业电脑)、工业相机(摄像头)、光源。

扩展阅读

我想对大家说的话
工作中遇到的问题,可以按类别查阅鄙人的算法文章,请点击《算法与数据汇总》。
学习算法:按章节学习《喜缺全书算法册》,大量的题目和测试用例,打包下载。重视操作
有效学习:明确的目标 及时的反馈 拉伸区(难度合适) 专注
员工说:技术至上,老板不信;投资人的代表说:技术至上,老板会信。
闻缺陷则喜(喜缺)是一个美好的愿望,早发现问题,早修改问题,给老板节约钱。
子墨子言之:事无终始,无务多业。也就是我们常说的专业的人做专业的事。
如果程序是一条龙,那算法就是他的是睛
失败+反思=成功 成功+反思=成功

视频课程

先学简单的课程,请移步CSDN学院,听白银讲师(也就是鄙人)的讲解。
https://edu.csdn.net/course/detail/38771

如何你想快速形成战斗了,为老板分忧,请学习C#入职培训、C++入职培训等课程
https://edu.csdn.net/lecturer/6176

测试环境

操作系统:win7 开发环境: VS2019 C++17

或者 操作系统:win10 开发环境: VS2022 C++17

如无特殊说明,本算法 用**C++**实现。

相关推荐
musk12123 小时前
深度学习词汇 - 中英对照词典(内容由AI生成) Deep Learning Vocabulary - English-Chinese Dictionary
人工智能·深度学习
职业码农NO.13 小时前
智能体AI的六大核心设计模式,很常见
人工智能·设计模式·系统架构·aigc·rag
KG_LLM图谱增强大模型3 小时前
SciDaSynth:基于大语言模型的科学文献交互式结构化数据提取系统
数据库·人工智能·大模型·知识图谱
NaturalHarmonia3 小时前
UIE信息抽取模型指代消解实战教程(extra)
人工智能·算法
Sahadev_3 小时前
GitHub 一周热门项目速览 | 2025年12月08日
java·大数据·人工智能·安全·ai作画
Eloudy3 小时前
jacobi solver 迭代算法
人工智能·算法·机器学习
不断学习加努力3 小时前
几种自动驾驶框架简要梳理
人工智能·机器学习·自动驾驶
草莓熊Lotso3 小时前
哈希表的两种灵魂:深入探索开放定址与链地址法的核心机密
linux·运维·数据结构·c++·人工智能·算法·哈希算法
亿坊电商3 小时前
AI数字人交互系统技术架构详解:核心模块全解析!
人工智能·架构·交互