【计算机视觉CV:标注工具】--labelimg+labelme

目录

1.labelimg

1.1.安装

1.2.介绍

1.3.使用

1.4.数据

2.labelme

2.1.安装

2.2.使用

2.3.数据


1.labelimg

LabelImg 是一个开源的图形化图像标注工具,主要用于创建用于训练机器学习模型(特别是目标检测模型)所需的标注数据。它由 Tzutalin 开发,采用 Python 编写,并基于 PyQt 架构实现图形用户界面(GUI)。LabelImg 支持多种标注格式,广泛应用于计算机视觉领域。

  1. 支持多种标注格式
    • Pascal VOC XML:这是 LabelImg 默认使用的格式,常用于如 Faster R-CNN 等经典目标检测模型。
    • YOLO TXT:适用于 YOLO(You Only Look Once)系列目标检测算法,每张图像对应一个 .txt 文件,记录归一化的边界框坐标和类别索引。
    • CreateML JSON(部分版本支持):适用于 Apple 的 Create ML 框架。
  2. 用户友好的图形界面
    • 可通过鼠标拖拽在图像上绘制矩形框(bounding box)。
    • 支持快捷键操作(如 W 创建新框、A/D 切换上一张/下一张图像等),提高标注效率。
    • 可自定义标签列表,避免重复输入类别名称。
  3. 开源免费

1.1.安装

使用pip安装

python 复制代码
pip install labelimg -i https://pypi.tuna.tsinghua.edu.cn/simple

然后等待其自动帮你安装labelimg以及lxml和pyqt5(下图由于笔者已经安装过了,就不重新卸载安装了)

使用直接打开:

python 复制代码
labelimg

1.2.介绍

可以看一下View这个菜单:

1.3.使用

1.我们打开需要标注的图片文件夹 ,然后右下角就会出现标注的图片,点击选中即可开始标注

并设置标注文件保存的目录(上图中的Change Save Dir)

2. 接下来就开始标注,画框,标记目标的label,然后d切换到下一张继续标注,不断重复重复

  • 选好图片之后,设置标注类型()

Pascal VOC XML:这是 LabelImg 默认使用的格式,常用于如 Faster R-CNN 等经典目标检测模型。

YOLO TXT:适用于 YOLO(You Only Look Once)系列目标检测算法,每张图像对应一个 .txt 文件,记录归一化的边界框坐标和类别索引。

CreateML JSON(部分版本支持):适用于 Apple 的 Create ML 框架。

  • 创建矩形框
  • 设置标签名称

1.4.数据

1.PASCAL VOC

最终保存为XML文件,标注完后,生成的xml文件就可以方便后续的xml_to_csv以及转换为tfrecord文件了。

图片大小、通道数、标签名称、选框位置的参数

2.yolo

①"classes.txt"定义了你的 YOLO 标签所引用的类名列表。

②具体的标注文件中每一行表示一个目标,以空格进行区分,分别表示目标的类别id,归一化处理之后的中心点x坐标、y坐标、目标框的w和h

2.labelme

LabelMe 是一个由 MIT(麻省理工学院)计算机科学与人工智能实验室(CSAIL)开发的开源图像标注工具,主要用于创建像素级或区域级的图像标注数据。它最初由 Russell 等人在 2008 年提出,旨在支持语义分割、实例分割、目标检测等计算机视觉任务的数据标注。

与仅支持矩形框标注的 LabelImg 不同,LabelMe 的核心优势在于支持任意形状的多边形(polygon)标注,因此特别适合需要精细标注的任务,如语义分割、实例分割或不规则物体的轮廓标注。

  1. 支持多种标注类型
    • 多边形(Polygon):可手动绘制任意形状的闭合区域,适用于精确分割。
    • 矩形框(Rectangle):兼容目标检测任务。
    • 点(Point)折线(Polyline):可用于关键点标注或路径标注。
    • 圆形、画笔(Brush)等(部分扩展版本支持)。
  2. 输出格式灵活
    • 默认输出为 JSON 格式,包含图像路径、图像尺寸、每个标注对象的标签和多边形顶点坐标。
    • 可通过脚本转换为 COCO、Pascal VOC、YOLO 或掩码(mask)图像等常用格式。
  3. 跨平台 & Web 支持
    • 提供 Web 版本(基于浏览器),无需安装即可使用(需本地运行服务器)。
    • 也提供 桌面版(基于 Python + PyQt),支持 Windows、macOS 和 Linux。
  4. 开源免费

2.1.安装

python 复制代码
pip install labelme==5.10.1 -i https://mirrors.aliyun.com/pypi/simple/

2.2.使用

创建多边形:形成一个完整的圈,就是初始点和末尾点重合即可

矩形、圆形、控制点、直线同理

折线

AI创建多边形:

可以在上侧选择对应模型:

选择之后点击图片终端会下载具体模型:

2.3.数据

就是每个点的坐标

图片信息

相关推荐
week_泽2 小时前
第10课:从零构建生产级AI Agent服务技术方案 - 学习笔记_10
人工智能·笔记·学习·ai agent
lynnlovemin2 小时前
AI时代信息安全:从挑战突围到智能防御体系构建
人工智能·信息安全
躺平的赶海人2 小时前
PyTorch 安装指南:快速开启深度学习之旅
人工智能·pytorch·深度学习
IT_陈寒2 小时前
Vue3性能优化实战:5个被低估的API让我减少了40%的代码量
前端·人工智能·后端
memmolo2 小时前
【3D视觉中的相机模型详解】
计算机视觉·3d·相机
Hcoco_me2 小时前
大模型面试题64:介绍下PPO的训练流程
人工智能·深度学习·机器学习·chatgpt·机器人
高洁012 小时前
AI智能体搭建(2)
人工智能·深度学习·算法·机器学习·知识图谱
IT=>小脑虎2 小时前
AI时代下后端的出路在哪?
人工智能·后端·学习
雨大王5122 小时前
如何通过WCS(仓储管理)系统实现汽车仓储的智能化升级?
人工智能·汽车·制造