Label Studio数据标注--通过源码安装

Label Studio是Heartex公司开发的一款在线数据标注工具,分为社区版(开源)和企业版(云服务,收费),企业版提供了增强的安全性(单点登录、角色基于访问控制、SOC2)、团队管理、分析和报告,以及正常运行时间和支持服务水平协议。即便是免费的开源版本,也足以支持广泛的标注类型,包括图像分类、目标检测、语义分割等。也支持多种数据类型,如文本、图像、音频和视频等。它还支持集成机器学习模型,可以满足各种复杂的数据标注需求。

安装Label Studio

Label Studio的安装方法有多种,主流的有pip、conda安装,也支持docker安装,这些安装方法,网上可以搜索到很多,这里不做介绍了。作为开发人员,更习惯于通过源码安装,本文就介绍如何从github上clone源码安装。

下载源码

安装poetry

Poetry 是一个 Python 打包和依赖管理工具,旨在简化 Python 包的创建、发布和依赖管理。与传统的 setuptools、pip 和 requirements.txt 的组合相比,Poetry 提供了一个统一和简化的工具和工作流程。

cd label-studio
pip install poetry

安装后,执行以下命令

  • poetry config list

    cache-dir = "/Users/oheroj/Library/Caches/pypoetry"
    experimental.system-git-client = false
    installer.max-workers = null
    installer.modern-installation = true
    installer.no-binary = null
    installer.parallel = true
    keyring.enabled = true
    solver.lazy-wheel = true
    virtualenvs.create = true
    virtualenvs.in-project = null
    virtualenvs.options.always-copy = false
    virtualenvs.options.no-pip = false
    virtualenvs.options.no-setuptools = false
    virtualenvs.options.system-site-packages = false
    virtualenvs.path = "{cache-dir}/virtualenvs" # /Users/laijihua/Library/Caches/pypoetry/virtualenvs
    virtualenvs.prefer-active-python = false
    virtualenvs.prompt = "{project_name}-py{python_version}"
    warnings.export = true

其中virtualenvs.create = true若改为 false,则可以停止 poetry 在检查不到虚拟环境是自动创建的行为模式,但是建议不要改动。

virtualenvs.in-project = false就是我们要修改的目标,使用指令:

poetry config virtualenvs.in-project true

虚拟环境将创建在项目根目录下,而不是在缓存目录下。

安装依赖

执行以下指令,安装依赖:

poetry install

如果出现以下错误

 - Installing label-studio-sdk (1.0.4 https://github.com/HumanSignal/label-studio-sdk/archive/0b7ece0554de291d05d446ea5240e56724e384e8.zip): Failed

  SSLCertVerificationError

  [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1129)

则执行以下指令

poetry add label-studio-sdk@latest

依赖包安装完成后,执行以下命令:

poetry run python label_studio/manage.py migrate
poetry run python label_studio/manage.py collectstatic

启动服务

poetry run python label_studio/manage.py runserver
相关推荐
小酋仍在学习19 天前
Ubuntu 24.04 LTS源码安装doccano
深度学习·ubuntu·数据标注
数字化营销工兵3 个月前
人工智能内容标签和披露:指南、样本和最佳实践
chatgpt·aigc·文本生成·数据标注·ai内容·内容披露·内容为王
代码魔法师!6 个月前
数据标注专业团队
数据标注
澳鹏Appen10 个月前
自动驾驶汽车:人工智能最具挑战性的任务
人工智能·机器学习·自动驾驶·汽车·训练数据·数据标注
澳鹏Appen10 个月前
激光雷达(LiDAR)技术
自动驾驶·训练数据·数据标注