【计算机视觉CV:标注工具】--labelimg+labelme

目录

1.labelimg

1.1.安装

1.2.介绍

1.3.使用

1.4.数据

2.labelme

2.1.安装

2.2.使用

2.3.数据


1.labelimg

LabelImg 是一个开源的图形化图像标注工具,主要用于创建用于训练机器学习模型(特别是目标检测模型)所需的标注数据。它由 Tzutalin 开发,采用 Python 编写,并基于 PyQt 架构实现图形用户界面(GUI)。LabelImg 支持多种标注格式,广泛应用于计算机视觉领域。

  1. 支持多种标注格式
    • Pascal VOC XML:这是 LabelImg 默认使用的格式,常用于如 Faster R-CNN 等经典目标检测模型。
    • YOLO TXT:适用于 YOLO(You Only Look Once)系列目标检测算法,每张图像对应一个 .txt 文件,记录归一化的边界框坐标和类别索引。
    • CreateML JSON(部分版本支持):适用于 Apple 的 Create ML 框架。
  2. 用户友好的图形界面
    • 可通过鼠标拖拽在图像上绘制矩形框(bounding box)。
    • 支持快捷键操作(如 W 创建新框、A/D 切换上一张/下一张图像等),提高标注效率。
    • 可自定义标签列表,避免重复输入类别名称。
  3. 开源免费

1.1.安装

使用pip安装

python 复制代码
pip install labelimg -i https://pypi.tuna.tsinghua.edu.cn/simple

然后等待其自动帮你安装labelimg以及lxml和pyqt5(下图由于笔者已经安装过了,就不重新卸载安装了)

使用直接打开:

python 复制代码
labelimg

1.2.介绍

可以看一下View这个菜单:

1.3.使用

1.我们打开需要标注的图片文件夹 ,然后右下角就会出现标注的图片,点击选中即可开始标注

并设置标注文件保存的目录(上图中的Change Save Dir)

2. 接下来就开始标注,画框,标记目标的label,然后d切换到下一张继续标注,不断重复重复

  • 选好图片之后,设置标注类型()

Pascal VOC XML:这是 LabelImg 默认使用的格式,常用于如 Faster R-CNN 等经典目标检测模型。

YOLO TXT:适用于 YOLO(You Only Look Once)系列目标检测算法,每张图像对应一个 .txt 文件,记录归一化的边界框坐标和类别索引。

CreateML JSON(部分版本支持):适用于 Apple 的 Create ML 框架。

  • 创建矩形框
  • 设置标签名称

1.4.数据

1.PASCAL VOC

最终保存为XML文件,标注完后,生成的xml文件就可以方便后续的xml_to_csv以及转换为tfrecord文件了。

图片大小、通道数、标签名称、选框位置的参数

2.yolo

①"classes.txt"定义了你的 YOLO 标签所引用的类名列表。

②具体的标注文件中每一行表示一个目标,以空格进行区分,分别表示目标的类别id,归一化处理之后的中心点x坐标、y坐标、目标框的w和h

2.labelme

LabelMe 是一个由 MIT(麻省理工学院)计算机科学与人工智能实验室(CSAIL)开发的开源图像标注工具,主要用于创建像素级或区域级的图像标注数据。它最初由 Russell 等人在 2008 年提出,旨在支持语义分割、实例分割、目标检测等计算机视觉任务的数据标注。

与仅支持矩形框标注的 LabelImg 不同,LabelMe 的核心优势在于支持任意形状的多边形(polygon)标注,因此特别适合需要精细标注的任务,如语义分割、实例分割或不规则物体的轮廓标注。

  1. 支持多种标注类型
    • 多边形(Polygon):可手动绘制任意形状的闭合区域,适用于精确分割。
    • 矩形框(Rectangle):兼容目标检测任务。
    • 点(Point)折线(Polyline):可用于关键点标注或路径标注。
    • 圆形、画笔(Brush)等(部分扩展版本支持)。
  2. 输出格式灵活
    • 默认输出为 JSON 格式,包含图像路径、图像尺寸、每个标注对象的标签和多边形顶点坐标。
    • 可通过脚本转换为 COCO、Pascal VOC、YOLO 或掩码(mask)图像等常用格式。
  3. 跨平台 & Web 支持
    • 提供 Web 版本(基于浏览器),无需安装即可使用(需本地运行服务器)。
    • 也提供 桌面版(基于 Python + PyQt),支持 Windows、macOS 和 Linux。
  4. 开源免费

2.1.安装

python 复制代码
pip install labelme==5.10.1 -i https://mirrors.aliyun.com/pypi/simple/

2.2.使用

创建多边形:形成一个完整的圈,就是初始点和末尾点重合即可

矩形、圆形、控制点、直线同理

折线

AI创建多边形:

可以在上侧选择对应模型:

选择之后点击图片终端会下载具体模型:

2.3.数据

就是每个点的坐标

图片信息

相关推荐
jllllyuz15 小时前
基于卷积神经网络(CNN)的图像融合方法详解
人工智能·神经网络·cnn
风流 少年15 小时前
解决AI画图的最后一公里-Next AI Draw.io MCP实践
人工智能·draw.io
OLOLOadsd12315 小时前
牛群目标检测新突破:基于YOLOv3-SPP的精准识别与优化策略
人工智能·yolo·目标检测
小鸡吃米…15 小时前
机器学习 - 贝叶斯定理
人工智能·python·机器学习
esmap15 小时前
技术解构:ESMAP AI数字孪生赋能传统行业转型的全链路技术方案
人工智能·低代码·ai·架构·编辑器·智慧城市
不懒不懒15 小时前
【逻辑回归从原理到实战:正则化、参数调优与过拟合处理】
人工智能·算法·机器学习
喜欢吃豆15 小时前
对象存储架构演进与AI大模型时代的深度融合:从S3基础到万亿参数训练的技术全景
人工智能·架构
ba_pi15 小时前
每天写点什么2026-02-2(1.5)数字化转型和元宇宙
大数据·人工智能
vlln15 小时前
【论文速读】MUSE: 层次记忆和自我反思提升的 Agent
人工智能·语言模型·自然语言处理·ai agent
Funny_AI_LAB15 小时前
RAD基准重新定义多视角异常检测,传统2D方法为何战胜前沿3D与VLM?
人工智能·目标检测·3d·ai