【超音速专利 CN116777899A】基于回归模型的工业图像关键点检测方法、系统及平台

申请号 CN202310942633.3
公开号(公开) CN116777899A
申请日 申请日 2023.07.28
申请人(公开) 超音速人工智能科技股份有限公司(833753)
发明人(公开) 张俊峰(总); 沈俊羽; 杨培文; 张小村

原文摘要

本发明公开了一种基于回归模型的工业图像关键点检测方法、系统及平台,本发明通过方法获取与工业图像关键点相对应的图像数据,并结合特征提取网络,实时生成与工业图像关键点相对应的特征图;通过卷积处理实时压缩所述特征图的特征信息,其中,所述卷积为1×1卷积;构建回归模型,并结合回归模型,实时生成与工业图像关键点相对应的检测数据,以及与所述方法相应的系统、平台以及存储介质;可以保留特征的全局空间信息,提高关键点预测的空间泛化性和稳定性。而且会可以实现关键点回归模型添加每个点的可见性功能。

AI摘要

问题: 传统方法空间信息丢失、过检率高、训练状态不直观。

方案核心:

结构创新: 提出FCNeck结构(1×1卷积+展平)替代全局池化,保留空间信息。

功能创新: 在回归模型中增加关键点"可见性"预测功能,通过额外标志位判断关键点是否存在,降低过检率。

训练创新: 使用复合损失函数(均方误差+交叉熵+残差似然估计),提升精度并使训练过程更稳定、直观。

效果: 提升了工业图像关键点检测的准确性、稳定性和实用性。

我的理解

本发明提供了一种基于回归模型的工业图像关键点检测方法,所述的方法包括如下步骤:

一、获取与工业图像关键点相对应的图像数据,并结合特征提取网络,实时生成与工业图像关键点相对应的特征图;

二、通过卷积处理实时压缩所述特征图的特征信息,其中,所述卷积为1×1卷积;

a、卷积压缩所述特征图的特征信息,生成与特征图相对应的具有通道数的特征图;

b、归一化处理所述具有通道数的特征图,并激活Relu激活函数,以及展平处理所述特征图的特征。

所述通过卷积处理实时压缩所述特征图的特征信息,其中,所述卷积为1×1卷积,还包括:

c、判定是否存在不可见的关键点,若存在,则结合关键点阈值,去除不可见的关键点;否则,执行下一步骤;

d、根据判定结果数据,实时生成与特征图相对应的关键点信息。

三、构建回归模型,并结合回归模型,实时生成与工业图像关键点相对应的检测数据。

a、实时获取与特征图相对应的关键点信息;并对所述关键点信息于全连接层的输出层数量加二处理;

b、生成带有至少两个标志位数据的关键点,其中,一个标志位表示关键点存在,第二个表示不存在;

c、对标志位的值进行softmax归一化处理,并生成与关键点相对应的索引。

所述构建回归模型,并结合回归模型,实时生成与工业图像关键点相对应的检测数据,还包括:

d、生成与关键点相对应的位置数据,以及关键点存在与否的数据信息。

所述构建回归模型,并结合回归模型,实时生成与工业图像关键点相对应的检测数据,还包括:

e、结合均方误差损失函数数据,实时生成模型预测值和真实值之间像素差的平方和数据;

f、根据损失函数值数据,判断回归模型于训练过程中的收敛状态。

所需硬件

工控机(工业电脑)、工业相机(摄像头)、光源。

扩展阅读

我想对大家说的话
工作中遇到的问题,可以按类别查阅鄙人的算法文章,请点击《算法与数据汇总》。
学习算法:按章节学习《喜缺全书算法册》,大量的题目和测试用例,打包下载。重视操作
有效学习:明确的目标 及时的反馈 拉伸区(难度合适) 专注
员工说:技术至上,老板不信;投资人的代表说:技术至上,老板会信。
闻缺陷则喜(喜缺)是一个美好的愿望,早发现问题,早修改问题,给老板节约钱。
子墨子言之:事无终始,无务多业。也就是我们常说的专业的人做专业的事。
如果程序是一条龙,那算法就是他的是睛
失败+反思=成功 成功+反思=成功

视频课程

先学简单的课程,请移步CSDN学院,听白银讲师(也就是鄙人)的讲解。
https://edu.csdn.net/course/detail/38771

如何你想快速形成战斗了,为老板分忧,请学习C#入职培训、C++入职培训等课程
https://edu.csdn.net/lecturer/6176

测试环境

操作系统:win7 开发环境: VS2019 C++17

或者 操作系统:win10 开发环境: VS2022 C++17

如无特殊说明,本算法 用**C++**实现。

相关推荐
badhope3 小时前
Mobile-Skills:移动端技能可视化的创新实践
开发语言·人工智能·git·智能手机·github
吴佳浩4 小时前
GPU 编号进阶:CUDA\_VISIBLE\_DEVICES、多进程与容器化陷阱
人工智能·pytorch·python
吴佳浩4 小时前
GPU 编号错乱踩坑指南:PyTorch cuda 编号与 nvidia-smi 不一致
人工智能·pytorch·nvidia
小饕5 小时前
苏格拉底式提问对抗315 AI投毒:实操指南
网络·人工智能
卧蚕土豆5 小时前
【有啥问啥】OpenClaw 安装与使用教程
人工智能·深度学习
GoCodingInMyWay5 小时前
开源好物 26/03
人工智能·开源
AI科技星5 小时前
全尺度角速度统一:基于 v ≡ c 的纯推导与验证
c语言·开发语言·人工智能·opencv·算法·机器学习·数据挖掘
zhangfeng11335 小时前
Windows 的 Git Bash 中使用 md5sum 命令非常简单 md5做文件完整性检测 WinRAR 可以计算文件的 MD5 值
人工智能·windows·git·bash
monsion5 小时前
OpenCode 学习指南
人工智能·vscode·架构
藦卡机器人5 小时前
中国工业机器人发展现状
大数据·人工智能·机器人