[论文][环境]DA3环境搭建_Ubuntu24

E 环境:

Ubuntu24.04

1 clone项目

bash 复制代码
git clone https://github.com/ByteDance-Seed/Depth-Anything-3.git

2 准备环境

2.1 依赖环境安装

需要先在本机安装CUDA,我安装的是11.8

2.1.1 GCC

先去CUDA官网的对应版本下面找到"Installation Guide Linux",比如我要安装11.8,就找11.8的"Installation Guide Linux"。

可以看到要求的版本是11,所以我们安装11,这一步骤解决的是failed to verify gcc version的错误。

bash 复制代码
sudo apt install gcc-11

安装之后,使用update-alternatives控制管理gcc的版本,我的系统里还有一个gcc-13

执行以下命令安装到update-alternatives,最后一个是权重

bash 复制代码
update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-11 10

之后看一眼版本是否切换过去了。

bash 复制代码
gcc --version

2.1.2 CUDA

照着这个走就可以了

由于我之前打过显卡驱动了,这里我们就选择继续。

接收条款协议之后,记得把驱动取消勾选,之后选择安装即可。

按照提示,添加环境变量。注意这里自己的显卡驱动一定要达到要求大于520.00.

vim ~/.bashrc添加环境变量

bash 复制代码
export PATH=/usr/local/cuda-11.8/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-11.8/lib64:$LD_LIBRARY_PATH
export CUDA_HOME=/usr/local/cuda

source ~/.bashrc更新环境

检查环境是否可用:

bash 复制代码
nvcc --version

2.2 DA3环境配置

2.2.1 激活conda环境

bash 复制代码
cd Depth-Anything-3
conda create -n da3 python=3.10.8
conda activate da3

2.2.2 安装GPU支持包

bash 复制代码
pip install torch==2.3.1 torchvision==0.18.1 xformers --index-url https://download.pytorch.org/whl/cu118 # 根据你主机安装的CUDA版本走
# pip install torch==2.3.1 torchvision==0.18.1 --index-url https://download.pytorch.org/whl/cu121 # 例如CUDA12.1可以用这个

这里应该检查一下,是不是正确安装了

python 复制代码
python #base
import torch
print(torch.__version__)           # 应该输出 2.3.1
print(torch.version.cuda)          # 应该输出 11.8
print(torch.cuda.is_available())   # 必须输出 True
exit() #base

2.2.3 安装其他

bash 复制代码
pip install -e . # Basic

pip install ninja # DA3要求本机编译,需要ninja

2.2.4 安装gsplat

这里我们不用DA3的README里面提供的安装指令安装,因为那个指令需要编译gsplat,我这边编译不过,Win那边编译过了,但是Ubuntu编译不过。所以直接使用官方提供好的二进制文件。

gsplat可以查看Github nerfstudio-project/gsplat

bash 复制代码
pip install ninja numpy jaxtyping rich
pip install gsplat --index-url https://docs.gsplat.studio/whl/pt23cu118

2.2.5 安装DA3应用

bash 复制代码
pip install -e ".[app]" # Gradio, python>=3.10
pip install -e ".[all]" # ALL

上面安装的gradio默认是最新的,目前我现在默认安装的是6.0,6.0更换了函数所属类。要使用旧版。

bash 复制代码
pip install addict
pip install gradio==5.49.1

如果没有报错就说明没有问题了。

3 使用方式

使用方式分为两种,API和CLI,这里使用CLI中的da3 gradio作为演示

https://github.com/ByteDance-Seed/Depth-Anything-3/blob/main/docs/CLI.md

可以查看上面的链接详细了解,

相关推荐
春日见6 小时前
5分钟入门强化学习之动态规划算法与实现
大数据·人工智能·python·算法·机器学习·计算机视觉
yubo05097 小时前
计算机视觉第三课:在图像上画框、画文字、画圆点
opencv·计算机视觉·目标跟踪
yubo050913 小时前
计算机视觉第五课:给每个物体画 bounding box
人工智能·opencv·计算机视觉
AI人工智能+14 小时前
赋能智慧监管:基于深度学习的特种行业许可证全要素精准识别系统
计算机视觉·自然语言处理·ocr·特种行业许可证识别
weixin_4684668515 小时前
机器学习与深度学习新手区分指南
人工智能·python·深度学习·机器学习·计算机视觉·ai·机器视觉
yubo050915 小时前
计算机视觉第四课:寻找轮廓(自动框出所有物体)
人工智能·opencv·计算机视觉
fie888915 小时前
近红外与可见光图像融合的ICA变换:原理、实现与应用
图像处理·人工智能·计算机视觉
sali-tec16 小时前
C# 基于OpenCv的视觉工作流-章79-单位转换
图像处理·人工智能·opencv·算法·计算机视觉
彭祥.16 小时前
无人考评利用旋转目标检测识别验电器
人工智能·目标检测·计算机视觉
AI人工智能+16 小时前
施工许可证智能识别系统通过融合计算机视觉与自然语言处理技术,实现了建筑行业关键证件的自动化信息提取
人工智能·深度学习·计算机视觉·ocr·施工许可证识别