Label Studio数据标注--通过源码安装

Label Studio是Heartex公司开发的一款在线数据标注工具,分为社区版(开源)和企业版(云服务,收费),企业版提供了增强的安全性(单点登录、角色基于访问控制、SOC2)、团队管理、分析和报告,以及正常运行时间和支持服务水平协议。即便是免费的开源版本,也足以支持广泛的标注类型,包括图像分类、目标检测、语义分割等。也支持多种数据类型,如文本、图像、音频和视频等。它还支持集成机器学习模型,可以满足各种复杂的数据标注需求。

安装Label Studio

复制代码
Label Studio的安装方法有多种,主流的有pip、conda安装,也支持docker安装,这些安装方法,网上可以搜索到很多,这里不做介绍了。作为开发人员,更习惯于通过源码安装,本文就介绍如何从github上clone源码安装。

下载源码

安装poetry

复制代码
Poetry 是一个 Python 打包和依赖管理工具,旨在简化 Python 包的创建、发布和依赖管理。与传统的 setuptools、pip 和 requirements.txt 的组合相比,Poetry 提供了一个统一和简化的工具和工作流程。

cd label-studio
pip install poetry

安装后,执行以下命令

  • poetry config list

    cache-dir = "/Users/oheroj/Library/Caches/pypoetry"
    experimental.system-git-client = false
    installer.max-workers = null
    installer.modern-installation = true
    installer.no-binary = null
    installer.parallel = true
    keyring.enabled = true
    solver.lazy-wheel = true
    virtualenvs.create = true
    virtualenvs.in-project = null
    virtualenvs.options.always-copy = false
    virtualenvs.options.no-pip = false
    virtualenvs.options.no-setuptools = false
    virtualenvs.options.system-site-packages = false
    virtualenvs.path = "{cache-dir}/virtualenvs" # /Users/laijihua/Library/Caches/pypoetry/virtualenvs
    virtualenvs.prefer-active-python = false
    virtualenvs.prompt = "{project_name}-py{python_version}"
    warnings.export = true

其中virtualenvs.create = true若改为 false,则可以停止 poetry 在检查不到虚拟环境是自动创建的行为模式,但是建议不要改动。

virtualenvs.in-project = false就是我们要修改的目标,使用指令:

复制代码
poetry config virtualenvs.in-project true

虚拟环境将创建在项目根目录下,而不是在缓存目录下。

安装依赖

执行以下指令,安装依赖:

复制代码
poetry install

如果出现以下错误

复制代码
 - Installing label-studio-sdk (1.0.4 https://github.com/HumanSignal/label-studio-sdk/archive/0b7ece0554de291d05d446ea5240e56724e384e8.zip): Failed

  SSLCertVerificationError

  [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1129)

则执行以下指令

复制代码
poetry add label-studio-sdk@latest

依赖包安装完成后,执行以下命令:

复制代码
poetry run python label_studio/manage.py migrate
poetry run python label_studio/manage.py collectstatic

启动服务

复制代码
poetry run python label_studio/manage.py runserver
相关推荐
晨曦5432102 天前
监督学习vs无监督学习:AI如何看懂世界
数据标注
康谋自动驾驶4 天前
分享 | 如何做好全自动化ADAS 高精度标注?
自动化·自动驾驶·数据采集·数据标注·技术解析
Big_Ambation11 天前
docker启动label studio中文版(一遍成功)
docker·数据标注·label studio
景联文科技17 天前
景联文 × 麦迪:归一医疗数据枢纽,构建AI医疗新底座
大数据·人工智能·数据标注
康谋自动驾驶25 天前
aiData全自动化数据处理解决方案!
自动驾驶·数据处理·传感器·数据标注·数据闭环·端对端
才思喷涌的小书虫1 个月前
DINO-X 视觉模板挑战赛火热报名中
人工智能·目标检测·计算机视觉·ai·数据标注·图像标注·模型定制
数据堂官方账号1 个月前
AI赋能工业4.0:数据堂一站式数据服务加速制造智能化落地
人工智能·机器人·数据集·人机交互·数据采集·数据标注·工业制造
lxmyzzs1 个月前
X-AnyLabeling 自动数据标注保姆级教程:从安装到格式转换全流程
人工智能·数据标注
漫谈网络1 个月前
数据标记与内容标注区别解析
机器学习·数据标注
才思喷涌的小书虫1 个月前
实战教程:从 0 到 1 手搓 DINO-X 定制模板,实现长尾场景精准检测和数据标注
人工智能·目标检测·计算机视觉·具身智能·数据标注·图像标注·模型定制