Ubuntu 24.04 LTS源码安装doccano

引言

doccano 是一款面向机器学习从业者的开源数据标记工具。您可以使用 doccano 执行不同类型的标记任务,支持多种数据格式。要了解 doccano 的功能,请试用doccano 演示版

1.软件下载

复制代码
git clone https://github.com/doccano/doccano.git
cd doccano

2.前后端依赖下载

doccano 后端内置于 Python 3.8+ 中,并使用Poetry作为依赖项管理器。首先我们下载Poetry。

我们使用pipx安装Poetry,如果没有安装pipx,请运行以下命令安装:

sudo apt update
sudo apt install pipx
pipx ensurepath
#允许全局范围内的 pipx 操作。
sudo pipx ensurepath --global
#查看版本
pipx --version

如果apt更新失败,修改以下文件

sudo nano /etc/apt/sources.list.d/ubuntu.sources

在文件中,将 cn.archive.ubuntu.com 替换为其他可靠的镜像源,例如 mirrors.ustc.edu.cnmirrors.aliyun.com

接下来安装Poetry

pipx install poetry
#让 pipx 自动将 ~/.local/bin 添加到你的 PATH 环境变量中
pipx ensurepath
复制代码
需要 打开一个新的终端窗口。

后端依赖安装

#先使用anaconda3创建一个虚拟环境
source ~/anaconda3/bin/activate
#python版本选择3.10不会有依赖冲突
conda create -n doccano python=3.10
conda activate doccano
​
#进入后端
cd backend
poetry install
#已经有创建的虚拟环境doccano,不需要运行了
poetry shell

前端依赖安装

先安装yarn

curl -sS https://dl.yarnpkg.com/debian/pubkey.gpg | sudo apt-key add -
echo "deb https://dl.yarnpkg.com/debian/ stable main" | sudo tee /etc/apt/sources.list.d/yarn.list
sudo apt update
sudo apt install yarn
​
#验证安装
yarn --version
​
#安装前端依赖
cd frontend
yarn install
​
复制代码

3.启动项目

后端:

cd backend
python manage.py migrate
python manage.py create_roles
python manage.py create_admin --noinput --username "admin" --email "admin@example.com" --password "password"
python manage.py runserver

在另一个终端中,您需要运行 Celery 来使用导入/导出数据集功能:

cd backend
celery --app=config worker --loglevel=INFO --concurrency=1

前端:

yarn dev

直接访问:

源码有一个问题,创建项目会报错,因为跨域问题:

需要修改doccano/doccano-master/backend/config/settings/base.py

把前端的IP地址和端口号加进去CSRF_TRUSTED_ORIGINS。

最后

如果不需要改源码建议pip直接安装

官方文档:Install and upgrade doccano - doccano

安装命令:

要使用 pip 安装 doccano,您需要 Python 3.8+。运行以下命令:

复制代码
pip install doccano

安装 doccano 后,使用以下命令启动服务器:

复制代码
# Initialize database. First time only.
doccano init
# Create a super user. First time only.
doccano createuser --username admin --password pass
# Start a web server.
doccano webserver --port 8000

在另一个终端中,运行以下命令:

复制代码
# Start the task queue to handle file upload/download.
doccano task

打开http://localhost:8000/

相关推荐
梓仁沐白28 分钟前
ubuntu+windows双系统切换后蓝牙设备无法连接
windows·ubuntu
老艾的AI世界7 小时前
AI翻唱神器,一键用你喜欢的歌手翻唱他人的曲目(附下载链接)
人工智能·深度学习·神经网络·机器学习·ai·ai翻唱·ai唱歌·ai歌曲
sp_fyf_202411 小时前
【大语言模型】ACL2024论文-19 SportsMetrics: 融合文本和数值数据以理解大型语言模型中的信息融合
人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理
CoderIsArt11 小时前
基于 BP 神经网络整定的 PID 控制
人工智能·深度学习·神经网络
写点什么啦11 小时前
[debug]不同的window连接ubuntu的vscode后无法正常加载kernel
linux·vscode·ubuntu·debug
z千鑫11 小时前
【人工智能】PyTorch、TensorFlow 和 Keras 全面解析与对比:深度学习框架的终极指南
人工智能·pytorch·深度学习·aigc·tensorflow·keras·codemoss
EterNity_TiMe_11 小时前
【论文复现】神经网络的公式推导与代码实现
人工智能·python·深度学习·神经网络·数据分析·特征分析
wellnw11 小时前
[ubuntu]编译共享内存读取出现read.c:(.text+0x1a): undefined reference to `shm_open‘问题解决方案
linux·ubuntu
思通数科多模态大模型12 小时前
10大核心应用场景,解锁AI检测系统的智能安全之道
人工智能·深度学习·安全·目标检测·计算机视觉·自然语言处理·数据挖掘
数据岛12 小时前
数据集论文:面向深度学习的土地利用场景分类与变化检测
人工智能·深度学习