【超音速专利 CN117611531A】一种工业尺寸测量方法

申请号 CN202311530227.2
公开号(公开) CN117611531A
申请日 申请日 2023.11.16
申请人(公开) 超音速人工智能科技股份有限公司(833753)
发明人(公开) 张俊峰(总); 杨培文(总); 沈俊羽; 张小村

原文摘要

本发明涉及一种工业尺寸测量方法,包括以下步骤:采集待检测物品的图像;提取图像中的多尺度特征,以及与多尺度特征对应的预测候选框;裁剪预测候选框内对应的特征,根据裁剪的特征,通过全连接网络得到每个预测候选框的类型和位置信息;将所有裁剪出的特征输入关键点检测分支,得到每个特征中所有类型点的横坐标值信息、纵坐标值信息和可见性信息;将预测候选框的类型与类型点进行匹配,通过网络预测可见性筛选出不存在的点,得到最终预测点的类型和坐标。本发明能在检测目标的同时,检测目标框中的点,仅需预测一次,算法速度快,能在高速生产下,实时检测工业零件的尺寸。

AI摘要

基于提供的专利文档,本发明涉及一种工业尺寸测量方法,旨在解决高速生产环境下工业零件尺寸实时检测的难题。以下是该方法的提炼摘要:

核心发明点:

提出一种基于改进Faster RCNN的端到端AI检测模型(Pose RCNN),通过在目标检测网络中集成关键点检测分支,实现单次预测即可同时定位零件边缘(预测框)和精确检测框内线段端点(关键点),从而高效计算零件尺寸。

主要技术方案:

图像处理流程:

采集待检测物品图像。

通过特征提取网络(如FPN)和RPN网络提取多尺度特征及预测候选框。

裁剪候选框内特征,经全连接网络预测框的类型和位置。

关键点检测分支:

将所有裁剪特征输入独立的关键点检测分支。

分支包含三个分类头:

横/纵坐标分类头:通过特定卷积(Conv2D_x/Conv2D_y)和反卷积操作,预测所有类型点的坐标(输出维度为c2×112)。

可见性分类头

通过卷积和全连接层预测点的可见性。

坐标信息经Soft-argmax函数解码为实际坐标。

类型匹配与筛选:

预设框类型与点类型的匹配关系(如表格定义)。

根据预测框类型自动筛选可见点,剔除不匹配点,输出最终点的类型和坐标。

技术优势:

高效实时:仅需单次模型预测即可处理多边缘检测,避免传统方法中多次运行模型的问题,显著提升检测速度。

简化流程:整合目标检测与关键点检测于单一模型,减少对多个数据集和模型的需求,降低操作复杂度。

精准匹配:通过框-点类型匹配机制,确保特定类型框仅检测对应类型点,提升测量准确性。

应用场景:

适用于工业制造中需快速精确测量零件尺寸的场合,如高速生产线上的质量控制。

步骤

一种工业尺寸测量方法,包括以下步骤:

一,采集待检测物品的图像;

二,提取图像中的多尺度特征,以及与多尺度特征对应的预测候选框;

三,裁剪预测候选框内对应的特征,根据裁剪的特征,通过全连接网络得到每个预测候选框的类型和位置信息;

四,将所有裁剪出的特征输入关键点检测分支,得到每个特征中所有类型点的横坐标值信息、纵坐标值信息和可见性信息;

五,将预测候选框的类型与类型点进行匹配,通过网络预测可见性筛选出不存在的点,得到最终预测点的类型和坐标。

六,提取图像中的多尺度特征的方法包括:将图片输入特征提取网络和特征金字塔网络,得到多尺度特征;提取与多尺度特征对应的预测候选框的方法包括:将多尺度特征经过RPN网络后,得到预测候选框。

七,裁剪预测候框内对应的特征后,通过ROI Aline1将裁剪的特征统一缩放到7×7的大小,缩放后的特征经过展平后,通过全连接网络得到预测候选框的类型和位置信息。

八,在将所有裁剪出的特征输入关键点检测分支前,还包括对关键点检测分支的训练,采集多张图片样本,通过真实框标选出图像样本中的特征,得到特征训练集,将特征训练集输入关键点检测分支中,训练完成后,得到训练好的关键点检测分支。

所述关键点检测分支包括以下步骤:

a,将所有裁剪出的特征通过28×28的ROI Aline2统一缩放到28×28的大小,得所有大小为(n, 64, 28, 28)的特征a,其中,n为所有预测候选框中的特征的数量;

b,将特征a中的所有特征输入纵坐标分类头,得到大小为(c2, 112)的所有类型点的纵坐标值信息;

c,将特征a中的所有特征输入横坐标分类头,得到大小为(c2, 112)的所有类型点的横坐标值信息;

d,将特征a中的所有特征输入可见性分类头,得到大小为(c2)的所有类型点的可见性信息。

e,进一步的,特征a中的特征输入纵坐标分类头后包括以下步骤:

将特征a中的特征经过Conv2D_y卷积和ReLU激活函数后,得到图像特征y1;

将特征y1经过Conv2D_y卷积和ReLU激活函数后,得到图像特征y2;

将特征y2展平后,得到特征y3;

将特征y3经过一维反卷积和ReLU激活函数后,得到特征y4;

将特征y4经过一维反卷积和ReLU激活函数后,得到类型点的纵坐标值信息。

f,进一步的,特征a中的特征输入横坐标分类头后包括以下步骤:

将特征a中的特征经过Conv2D_x卷积和ReLU激活函数后,得到图像特征x1;

将特征x1经过Conv2D_x卷积和ReLU激活函数后,得到图像特征x2;

将特征x2展平后,得到特征x3;

将特征x3经过一维反卷积和ReLU激活函数后,得到特征x4;

将特征x4经过一维反卷积和ReLU激活函数后,得到类型点的横坐标值信息。

g,特征a中的特征输入可见性分类头后包括以下步骤:

将特征a中的特征经过两次Conv2D卷积和ReLU激活函数后,再经过全局池化、展平和全连接后,得到类型点的可见性信息。

h,所有类型点的横坐标信息和纵坐标信息经过Soft-argmax函数后,得到所有类型点的坐标。

i,预测候选框的类型与类型点进行匹配的方法包括以下步骤:

设置框的类型与点的类型的匹配关系;

将与框类型匹配的类型点的可见性设置为可见,不匹配的点设置为不可见。

扩展阅读

我想对大家说的话
工作中遇到的问题,可以按类别查阅鄙人的算法文章,请点击《算法与数据汇总》。
学习算法:按章节学习《喜缺全书算法册》,大量的题目和测试用例,打包下载。重视操作
有效学习:明确的目标 及时的反馈 拉伸区(难度合适) 专注
员工说:技术至上,老板不信;投资人的代表说:技术至上,老板会信。
闻缺陷则喜(喜缺)是一个美好的愿望,早发现问题,早修改问题,给老板节约钱。
子墨子言之:事无终始,无务多业。也就是我们常说的专业的人做专业的事。
如果程序是一条龙,那算法就是他的是睛
失败+反思=成功 成功+反思=成功

视频课程

先学简单的课程,请移步CSDN学院,听白银讲师(也就是鄙人)的讲解。
https://edu.csdn.net/course/detail/38771

如何你想快速形成战斗了,为老板分忧,请学习C#入职培训、C++入职培训等课程
https://edu.csdn.net/lecturer/6176

测试环境

操作系统:win7 开发环境: VS2019 C++17

或者 操作系统:win10 开发环境: VS2022 C++17

如无特殊说明,本算法 用**C++**实现。

相关推荐
一个处女座的程序猿1 小时前
AGI:《从规模扩张到研究驱动:Ilya Sutskever畅谈AI泛化瓶颈、人类学习启事与超级智能未来之路》
人工智能·llms·ilya sutskever
工藤学编程1 小时前
零基础学AI大模型之Milvus实战:Attu可视化安装+Python整合全案例
人工智能·python·milvus
V_156560272191 小时前
第一批!2026年陕西省科技攻关项目申报时间条件程序
大数据·人工智能·科技
双翌视觉1 小时前
基于VisionBeaver机器视觉系统对FPC柔性线路板的AOI检测
人工智能·机器学习·制造
360智汇云1 小时前
智汇云API市场:大模型流式语音识别
人工智能·语音识别·xcode
北堂飘霜1 小时前
AI 求职工具简小派:用智能协作系统实现 AI 优化简历与全流程求职提升
人工智能
智算菩萨1 小时前
大规模语音与语音对话模型:从 ASR/TTS 到情感与意图理解
人工智能·自然语言处理·语音识别
不叫猫先生1 小时前
基于AI代理浏览器的自动化数据爬取实践
人工智能·爬虫·自动化
Hernon1 小时前
AI智能体 - 目标设定与监控模式
人工智能·langchain·ai智能体·ai开发框架·设计方法论
方知我1 小时前
【GoogLeNet】基本原理
人工智能·pytorch·深度学习·神经网络·cnn