【超音速专利 CN116777899A】基于回归模型的工业图像关键点检测方法、系统及平台

申请号 CN202310942633.3
公开号(公开) CN116777899A
申请日 申请日 2023.07.28
申请人(公开) 超音速人工智能科技股份有限公司(833753)
发明人(公开) 张俊峰(总); 沈俊羽; 杨培文; 张小村

原文摘要

本发明公开了一种基于回归模型的工业图像关键点检测方法、系统及平台,本发明通过方法获取与工业图像关键点相对应的图像数据,并结合特征提取网络,实时生成与工业图像关键点相对应的特征图;通过卷积处理实时压缩所述特征图的特征信息,其中,所述卷积为1×1卷积;构建回归模型,并结合回归模型,实时生成与工业图像关键点相对应的检测数据,以及与所述方法相应的系统、平台以及存储介质;可以保留特征的全局空间信息,提高关键点预测的空间泛化性和稳定性。而且会可以实现关键点回归模型添加每个点的可见性功能。

AI摘要

问题: 传统方法空间信息丢失、过检率高、训练状态不直观。

方案核心:

结构创新: 提出FCNeck结构(1×1卷积+展平)替代全局池化,保留空间信息。

功能创新: 在回归模型中增加关键点"可见性"预测功能,通过额外标志位判断关键点是否存在,降低过检率。

训练创新: 使用复合损失函数(均方误差+交叉熵+残差似然估计),提升精度并使训练过程更稳定、直观。

效果: 提升了工业图像关键点检测的准确性、稳定性和实用性。

我的理解

本发明提供了一种基于回归模型的工业图像关键点检测方法,所述的方法包括如下步骤:

一、获取与工业图像关键点相对应的图像数据,并结合特征提取网络,实时生成与工业图像关键点相对应的特征图;

二、通过卷积处理实时压缩所述特征图的特征信息,其中,所述卷积为1×1卷积;

a、卷积压缩所述特征图的特征信息,生成与特征图相对应的具有通道数的特征图;

b、归一化处理所述具有通道数的特征图,并激活Relu激活函数,以及展平处理所述特征图的特征。

所述通过卷积处理实时压缩所述特征图的特征信息,其中,所述卷积为1×1卷积,还包括:

c、判定是否存在不可见的关键点,若存在,则结合关键点阈值,去除不可见的关键点;否则,执行下一步骤;

d、根据判定结果数据,实时生成与特征图相对应的关键点信息。

三、构建回归模型,并结合回归模型,实时生成与工业图像关键点相对应的检测数据。

a、实时获取与特征图相对应的关键点信息;并对所述关键点信息于全连接层的输出层数量加二处理;

b、生成带有至少两个标志位数据的关键点,其中,一个标志位表示关键点存在,第二个表示不存在;

c、对标志位的值进行softmax归一化处理,并生成与关键点相对应的索引。

所述构建回归模型,并结合回归模型,实时生成与工业图像关键点相对应的检测数据,还包括:

d、生成与关键点相对应的位置数据,以及关键点存在与否的数据信息。

所述构建回归模型,并结合回归模型,实时生成与工业图像关键点相对应的检测数据,还包括:

e、结合均方误差损失函数数据,实时生成模型预测值和真实值之间像素差的平方和数据;

f、根据损失函数值数据,判断回归模型于训练过程中的收敛状态。

所需硬件

工控机(工业电脑)、工业相机(摄像头)、光源。

扩展阅读

我想对大家说的话
工作中遇到的问题,可以按类别查阅鄙人的算法文章,请点击《算法与数据汇总》。
学习算法:按章节学习《喜缺全书算法册》,大量的题目和测试用例,打包下载。重视操作
有效学习:明确的目标 及时的反馈 拉伸区(难度合适) 专注
员工说:技术至上,老板不信;投资人的代表说:技术至上,老板会信。
闻缺陷则喜(喜缺)是一个美好的愿望,早发现问题,早修改问题,给老板节约钱。
子墨子言之:事无终始,无务多业。也就是我们常说的专业的人做专业的事。
如果程序是一条龙,那算法就是他的是睛
失败+反思=成功 成功+反思=成功

视频课程

先学简单的课程,请移步CSDN学院,听白银讲师(也就是鄙人)的讲解。
https://edu.csdn.net/course/detail/38771

如何你想快速形成战斗了,为老板分忧,请学习C#入职培训、C++入职培训等课程
https://edu.csdn.net/lecturer/6176

测试环境

操作系统:win7 开发环境: VS2019 C++17

或者 操作系统:win10 开发环境: VS2022 C++17

如无特殊说明,本算法 用**C++**实现。

相关推荐
编码小哥36 分钟前
OpenCV Haar级联分类器:人脸检测入门
人工智能·计算机视觉·目标跟踪
程序员:钧念44 分钟前
深度学习与强化学习的区别
人工智能·python·深度学习·算法·transformer·rag
Katecat996631 小时前
YOLOv8-Seg改进系列真空喷嘴质量检测与分类任务实现
yolo·分类·数据挖掘
数据与后端架构提升之路1 小时前
TeleTron 源码揭秘:如何用适配器模式“无缝魔改” Megatron-Core?
人工智能·python·适配器模式
Chef_Chen2 小时前
数据科学每日总结--Day44--机器学习
人工智能·机器学习
这张生成的图像能检测吗2 小时前
(论文速读)FR-IQA:面向广义图像质量评价:放松完美参考质量假设
人工智能·计算机视觉·图像增强·图像质量评估指标
KG_LLM图谱增强大模型2 小时前
本体论与知识图谱:揭示语义技术的核心差异
人工智能·知识图谱·本体论
JOBkiller1233 小时前
基于YOLOv8-Seg-RepHGNetV2的银耳缺陷检测与分类实现
yolo·分类·数据挖掘
JicasdC123asd3 小时前
黄瓜植株目标检测:YOLOv8结合Fasternet与BiFPN的高效改进方案
人工智能·yolo·目标检测
爱吃泡芙的小白白3 小时前
深入解析:2024年AI大模型核心算法与应用全景
人工智能·算法·大模型算法