【计算机视觉CV:标注工具】--labelimg+labelme

1.labelimg

1.1.安装

1.2.介绍

1.3.使用

1.labelimg

LabelImg 是一个开源的图形化图像标注工具，主要用于创建用于训练机器学习模型（特别是目标检测模型）所需的标注数据。它由 Tzutalin 开发，采用 Python 编写，并基于 PyQt 架构实现图形用户界面（GUI）。LabelImg 支持多种标注格式，广泛应用于计算机视觉领域。

支持多种标注格式 ：
- Pascal VOC XML：这是 LabelImg 默认使用的格式，常用于如 Faster R-CNN 等经典目标检测模型。
- YOLO TXT：适用于 YOLO（You Only Look Once）系列目标检测算法，每张图像对应一个 .txt 文件，记录归一化的边界框坐标和类别索引。
- CreateML JSON（部分版本支持）：适用于 Apple 的 Create ML 框架。
用户友好的图形界面 ：
- 可通过鼠标拖拽在图像上绘制矩形框（bounding box）。
- 支持快捷键操作（如 W 创建新框、A/D 切换上一张/下一张图像等），提高标注效率。
- 可自定义标签列表，避免重复输入类别名称。
开源免费 ：
- 项目托管在 GitHub 上（https://github.com/tzutalin/labelImg
  
  ），遵循MIT 许可证，允许自由使用、修改和分发。

1.1.安装

使用pip安装

python 复制代码

pip install labelimg -i https://pypi.tuna.tsinghua.edu.cn/simple

然后等待其自动帮你安装labelimg以及lxml和pyqt5（下图由于笔者已经安装过了，就不重新卸载安装了）

使用直接打开：

python 复制代码

labelimg

1.2.介绍

可以看一下View这个菜单：

1.3.使用

1.我们打开需要标注的图片文件夹，然后右下角就会出现标注的图片，点击选中即可开始标注

并设置标注文件保存的目录（上图中的Change Save Dir）

2. 接下来就开始标注，画框，标记目标的label，然后d切换到下一张继续标注，不断重复重复

选好图片之后，设置标注类型（）

Pascal VOC XML：这是 LabelImg 默认使用的格式，常用于如 Faster R-CNN 等经典目标检测模型。

YOLO TXT：适用于 YOLO（You Only Look Once）系列目标检测算法，每张图像对应一个 .txt 文件，记录归一化的边界框坐标和类别索引。

CreateML JSON（部分版本支持）：适用于 Apple 的 Create ML 框架。

创建矩形框
设置标签名称

1.4.数据

1.PASCAL VOC

最终保存为XML文件，标注完后，生成的xml文件就可以方便后续的xml_to_csv以及转换为tfrecord文件了。

（图片大小、通道数、标签名称、选框位置的参数）

2.yolo

①"classes.txt"定义了你的 YOLO 标签所引用的类名列表。

②具体的标注文件中每一行表示一个目标，以空格进行区分，分别表示目标的类别id，归一化处理之后的中心点x坐标、y坐标、目标框的w和h。

2.labelme

LabelMe 是一个由 MIT（麻省理工学院）计算机科学与人工智能实验室（CSAIL）开发的开源图像标注工具，主要用于创建像素级或区域级的图像标注数据。它最初由 Russell 等人在 2008 年提出，旨在支持语义分割、实例分割、目标检测等计算机视觉任务的数据标注。

与仅支持矩形框标注的 LabelImg 不同，LabelMe 的核心优势在于支持任意形状的多边形（polygon）标注，因此特别适合需要精细标注的任务，如语义分割、实例分割或不规则物体的轮廓标注。

支持多种标注类型 ：
- 多边形（Polygon）：可手动绘制任意形状的闭合区域，适用于精确分割。
- 矩形框（Rectangle）：兼容目标检测任务。
- 点（Point） 和 折线（Polyline）：可用于关键点标注或路径标注。
- 圆形、画笔（Brush）等（部分扩展版本支持）。
输出格式灵活 ：
- 默认输出为 JSON 格式，包含图像路径、图像尺寸、每个标注对象的标签和多边形顶点坐标。
- 可通过脚本转换为 COCO、Pascal VOC、YOLO 或掩码（mask）图像等常用格式。
跨平台 & Web 支持 ：
- 提供 Web 版本（基于浏览器），无需安装即可使用（需本地运行服务器）。
- 也提供 桌面版（基于 Python + PyQt），支持 Windows、macOS 和 Linux。
开源免费 ：
- 项目托管在 GitHub：https://github.com/wkentaro/labelme
- 采用 MIT 许可证，允许自由使用和二次开发。

2.1.安装

python 复制代码

pip install labelme==5.10.1 -i https://mirrors.aliyun.com/pypi/simple/

2.2.使用

创建多边形：形成一个完整的圈，就是初始点和末尾点重合即可

矩形、圆形、控制点、直线同理

折线：

AI创建多边形：

可以在上侧选择对应模型：

选择之后点击图片终端会下载具体模型：

2.3.数据

就是每个点的坐标

图片信息