构建视觉词典(visual vocabulary / codebook)

构建视觉词典就是把大量局部描述子(比如 ORB 的二进制描述子)聚成若干类"视觉单词"(visual words)。每个簇心代表一类相似的局部图像模式(比如"椅子腿的某种局部纹理")。之后把每张图像里出现的这些单词频率统计成一个定长向量(BoW histogram),用于训练分类器。

1. 整体流程(高层次步骤)

  1. 对训练集中每张图像用 ORB 提取描述子(descriptors)。

  2. 把所有图像的描述子合并成一个大集合(可能很大)。

  3. 对集合采样(必要时),然后对描述子做聚类(通常用 k-means)得到 K 个簇心(这就是视觉词典)。

  4. 对每张图像,把它的描述子映射到最近的簇心,统计每个簇心出现的次数 → 得到长度为 K 的直方图(BoW)。

  5. 对直方图做归一化 / TF-IDF / L2 标准化 等预处理,再送入分类器(SVM等)。

相关推荐
deng12047 分钟前
【yolov1:开启目标检测的全新纪元】
人工智能·yolo·目标检测
宇擎智脑科技8 分钟前
A2UI 技术原理深度解析:AI Agent 如何安全生成富交互 UI
人工智能·a2ui
kicikng8 分钟前
智能体来了(西南总部)完整拆解:AI Agent 指挥官 + AI调度官架构图
大数据·人工智能·多智能体系统·ai agent指挥官·ai调度官
夜斗小神社24 分钟前
【黑马RAG与Agent智能体项目】(二)提示词工程
人工智能
C++ 老炮儿的技术栈25 分钟前
不调用C++/C的字符串库函数,编写函数strcmp
c语言·开发语言·c++·人工智能·windows·git·visual studio
码农三叔30 分钟前
(6-1)手部、足部与末端执行器设计:仿生手设计
人工智能·架构·机器人·人形机器人
liliangcsdn31 分钟前
RL中GAE的计算过程详解
大数据·人工智能·算法
yhyvc33 分钟前
人形具身机器人国产/进口快速选型优先级清单
人工智能·机器人
wangmengxxw42 分钟前
SpringAI-mysql
java·数据库·人工智能·mysql·springai
考證寶題庫網1 小时前
Designing and Implementing a Microsoft Azure AI Solution 微軟Azure AI-102 認證全攻略
人工智能·microsoft·azure