Label Studio 安装与使用完整文档(可直接复制部署)

一、工具介绍

Label Studio 是开源免费的数据标注工具,支持图像、文本、语音、时序数据标注,广泛用于深度学习数据集制作。

特点:跨平台、部署简单、支持团队协作、支持导出 YOLO / COCO / JSON 等训练格式,非常适合目标检测、分类、缺陷检测等项目。

二、环境要求

  1. Python:3.8 ~ 3.11(不支持 3.12 及以上)
  2. 系统:Windows / Mac / Linux
  3. 网络:可正常访问 pip 源

三、推荐安装方式(Python 虚拟环境,最稳无冲突)

  1. 创建虚拟环境

python -m venv label-studio-env

  1. 激活虚拟环境

Windows CMD:

label-studio-env\Scripts\activate

Windows PowerShell:

.\label-studio-env\Scripts\Activate.ps1

Mac / Linux:

source label-studio-env/bin/activate

  1. 国内镜像安装(推荐)

pip install label-studio -i https://pypi.tuna.tsinghua.edu.cn/simple

  1. 验证安装

label-studio --version

四、CondaI安装方式(多项目环境适用)

conda create --name label-studio python=3.9 -y

conda activate label-studio

pip install label-studio -i https://pypi.tuna.tsinghua.edu.cn/simple

五、Docker安装(服务器/团队部署)

docker run -it -p 8080:8080 -v $(pwd)/label-studio-data:/label-studio/data heartexlabs/label-studio:latest

六、启动服务

默认启动:

label-studio start

端口占用时更换端口:

label-studio start --port 8081

访问地址:

http://localhost:8080

首次打开注册账号密码即可本地使用。

七、完整使用流程

  1. 新建项目

    Create Project

    填写项目名称、备注

    Save 保存

  2. 导入数据

    Import

    上传图片 / 文本文件

    支持批量上传文件夹

  3. 设置标注模板(关键)

    进入项目设置 --- Labeling Interface

    常用模板选择:

  • 图像分类:Image Classification
  • 目标检测/缺陷框选:Object Detection with Bounding Boxes
  • 文本分类:Text Classification
    手动添加自定义标签,保存模板。
  1. 开始标注
    点击 Label 进入标注界面
    框选目标区域、选择对应标签
    Ctrl+Enter 快速保存并下一张
    导出数据集(用于模型训练)

进入 Export:

  • YOLO 模型:导出 YOLO 格式
  • COCO 模型:导出 COCO JSON
  • 自用调试:JSON / CSV
    下载解压后可直接用于 YOLOv8、YOLOv9 训练。

八、常用快捷键

Ctrl+Enter:提交当前标注并下一张

数字键 1 2 3:快速选标签

Delete:删除标注框

滚轮:缩放图片

九、常见问题解决

  1. 启动失败、版本报错
    使用 Python3.9 最稳定。
  2. 8080 端口占用
    label-studio start --port 自定义端口
  3. PowerShell 无法激活环境
    管理员执行:
    set-ExecutionPolicy RemoteSigned
  4. 导入 CSV 失败
    去掉换行、使用纯英文格式文本。

十、使用总结

  1. 本地开发优先使用虚拟环境 pip 安装,零冲突、开箱即用。
  2. 工业缺陷检测、目标检测项目优先使用 bounding box 模板。
  3. 标注完成直接导出 YOLO 格式,可无缝对接深度学习训练。
  4. 支持预标注、模型辅助标注,大幅提升数据集制作效率。
相关推荐
Lihua奏1 天前
从单核到多核:CPU为什么不能再只靠提频变快
深度学习
拾年2751 天前
大模型的"聪明"从哪来?聊聊 AI 数据集的那些事儿
人工智能·深度学习·机器学习
韩师傅3 天前
海天线算法的前世今生
python·计算机视觉
韩师傅3 天前
当你的甲方设备过烂,要如何快速出效果?
python·计算机视觉
韩师傅3 天前
当你的甲方吐槽天空不够蓝,你应该如何应对
python·计算机视觉
饼干哥哥5 天前
开源Skills|搭建亚马逊动态关键词库系统,每天抓SSS级机会词
人工智能·深度学习·数据分析
武子康7 天前
调查研究-191 SenseVoice 不只是 ASR:把语音从“转文字“升级成“理解状态“
人工智能·深度学习·openai
武子康9 天前
调查研究-189 Kronos 调研:金融 K 线基础模型,是真突破,还是量化圈的新玩具?
人工智能·深度学习·openai
兵慌码乱10 天前
基于 MediaPipe 与 PySide2 的手势交互音乐控制系统实现:轻量化视觉交互全流程解析
python·opencv·计算机视觉·人机交互·手势识别·mediapipe·pyside2
小小杨树12 天前
读懂色彩:拍照调色不再难
算法·计算机视觉·配色