VisionPro Blob、条码识别、OCR 结构化速记版

VisionPro Blob、条码识别、OCR 结构化速记版

一、Blob 斑点分析工具(CogBlobTool)

1. 核心速记

  • 原理:灰度阈值分割 + 连通域分析,区分前景(斑点)与背景

  • 输出:面积、质心、周长、主轴、圆度、孔洞数等

  • 适用:目标形状/尺寸差异大、高对比度、无重叠(药片、胶点、墨点)

  • 关键:分割模式选对,连通域匹配目标,形态学优化

2. 关键参数(必记)

  • 极性:黑底白点/白底黑点(目标与背景灰度关系)

  • 分割模式(核心):

    • 固定硬阈值:光照稳、双峰分布,速度最快(一刀切)

    • 相对硬阈值:光照变化,按像素占比分割(抗光强)

    • 动态硬阈值:自动算阈值,适合双峰分布

    • 固定软阈值:目标与背景有过渡区(分三层,含过渡区)

  • 连通性:8邻域(目标,含斜对角)/4邻域(背景,仅上下左右)

  • 形态学:膨胀(填孔)、腐蚀(去毛刺),仅操作白色区域

  • 筛选:按面积、圆度等范围过滤无效斑点(属性越少越快)

3. 操作流程(直接套用)

  1. 加载图像 → 添加 CogBlobTool

  2. 设置极性 → 选择分割模式 → 调整阈值/占比(预览分割效果)

  3. 按需添加形态学操作(去毛刺/填孔)

  4. 设置筛选条件 → 运行工具 → 查看有效结果

二、条码识别工具(CogIDTool)

1. 核心速记

  • 优势:同时支持一维+二维码,同图多码、高旋转/透视变形可识别

  • 算法:IDQuick(快速,高质量码)、IDMax(默认,低质量/污损码)

  • 条码等级(ISO):A(最优)>B>C>D>F(无法识别)

  • DPM:直接元件标记(激光/喷墨),首选Data Matrix、QR Code

2. 一维码 vs 二维码(必记)

  • 一维码:仅宽度存数据(Code 128/39、UPC/EAN),数据量小,需静区

  • 二维码:长宽均存数据(QR、Data Matrix),数据量大、有容错、360°可读

3. 关键要求

  • 一维码:码宽>50像素,对比度>32,必须有静区

  • 二维码:四周有等宽静区即可,要求较低

4. 操作流程(直接套用)

  1. 加载图像 → 添加 CogIDTool

  2. 选择解码算法(默认IDMax) → 勾选支持的码型

  3. 框选ROI(缩小范围,提升速度)

  4. 运行工具 → 查看解码字符串、中心坐标、角度

三、OCR 字符识别工具(CogOCRMaxTool)

1. 核心速记

  • 原理:字符分割 → 字符训练(建库) → 模板匹配识别

  • 适用:生产日期、序列号、批次号等印刷/雕刻字符

  • 关键:字符可分割、字符库完整、训练与识别方向一致

2. 关键步骤(必记)

  • 字符分割:调整阈值、字符宽/间距,确保单个字符无粘连、无断裂

  • 字符训练:添加所有待识别字符(建库),支持加载/保存字符库

  • 注意:多行字符需多个OCR工具;字符位置不定先定位(PMA/Blob)

3. 操作流程(直接套用)

  1. 加载图像 → 添加 CogOCRMaxTool

  2. 框选ROI → 设置字符方向 → 调整阈值与分割参数

  3. 提取字符 → 建立字符库(添加所有待识别字符)

  4. 运行工具 → 查看识别结果 → 保存字符库(复用)

四、三大工具选型速记

  • Blob:二维连通区域(高对比度、无重叠、形状差异大)

  • CogIDTool:条码/二维码(追溯、标签、DPM元件)

  • CogOCRMaxTool:字符读取(生产日期、序列号)

相关推荐
反向跟单策略3 分钟前
期货反向跟单-2025年回顾及2026年展望
大数据·人工智能·学习·数据分析·区块链
yunhuibin24 分钟前
GoogLeNet学习
人工智能·python·深度学习·神经网络·学习
luoganttcc40 分钟前
Taalas 将人工智能模型蚀刻到晶体管上,以提升推理能力
人工智能·fpga开发
冬奇Lab1 小时前
一天一个开源项目(第33篇):MyCodeAgent - 面向学习的 Claude Code 风格代码代理框架
人工智能·开源·资讯
散峰而望1 小时前
C++ 启程:从历史到实战,揭开命名空间的神秘面纱
c语言·开发语言·数据结构·c++·算法·github·visual studio
deephub1 小时前
RAG 中分块重叠的 8 个隐性开销与权衡策略
人工智能·大语言模型·rag·检索
Ethan Hunt丶1 小时前
MSVTNet: 基于多尺度视觉Transformer的运动想象EEG分类模型
人工智能·深度学习·算法·transformer·脑机接口
康康的AI博客2 小时前
智能情感分析与品牌策略优化:如何通过AI洞察提升企业市场响应力
大数据·数据库·人工智能
仟濹2 小时前
【算法打卡day10(2026-02-24 周二)复习算法:DFS BFS 并查集】
算法·深度优先·图论·dfs·bfs·广度优先·宽度优先
亚古数据2 小时前
法国公司的类型:探索法国企业的多样形态
大数据·人工智能·亚古数据·法国公司