记录一次深度学习+SSH的配置

太久没碰深度学习了...全忘了主包重新来吧,自用。

参考:D-FINE安装部署全攻略:从环境配置到模型推理完整流程-CSDN博客

一.本次配置的是dfine模型的环境:

在Vscode+远程上训练:


一.首先anaconda创建一个专属的虚拟环境:

python 复制代码
#创建虚拟环境 
conda create -n dfine python=3.12
conda activate dfine
 
# 安装核心依赖
pip install torch>=2.0.1 torchvision>=0.15.2 -i https://pypi.tuna.tsinghua.edu.cn/simple

pip install faster-coco-eval>=1.6.6 PyYAML tensorboard scipy
pip install calflops transformers loguru
python 复制代码
# ONNX相关工具
pip install onnx onnxsim onnxruntime
 
# TensorRT部署(需要CUDA环境)
pip install tensorrt
 
# OpenVINO部署  
pip install openvino
 
# 可视化工具
pip install fiftyone

-i https://pypi.tuna.tsinghua.edu.cn/simple

去网站:D-FINE:D-FINE: Redefine Regression Task of DETRs as Fine-grained Distribution Refinement 💥💥💥 - GitCode

点击clone。

python 复制代码
cd D-FINE

//cd到刚刚clone的zip目录里,然后:
pip install -r requirements.txt

到这一步,接下来:验证

  1. PyTorch 能否调用 GPU(CUDA 路径正确否)
python 复制代码
python -c "import torch, platform, cv2; print('Python', platform.python_version()); print('Torch', torch.__version__); print('CUDA available', torch.cuda.is_available()); print('cuDNN ver', torch.backends.cudnn.version())"

结果是:

python 复制代码
Python 3.12.11
Torch 2.8.0+cpu
CUDA available False
cuDNN ver None

说明:你装的是 CPU 版 PyTorch ,所以 CUDA/cuDNN 全是 None。

在 D-FINE 里训练或大图推理会很慢,必须换成 GPU 版 wheel

因此我们需要:

两步切到 GPU 版(保持清华源加速)

你装的是 CPU 版 PyTorch ,所以 CUDA/cuDNN 全是 None。

在 D-FINE 里训练或大图推理会很慢,必须换成 GPU 版 wheel


两步切到 GPU 版(保持清华源加速)

  1. 先卸载 CPU 版

    pip uninstall -y torch torchvision

2.按你的驱动版本选一条命令(驱动 ≥ 525 就用 CUDA 12,否则用 11.8):

这里通过命令:查看自己的cuda版本,我的是12.9.

python 复制代码
nvidia-smi

接下来去PyTorch

python 复制代码
pip3 install torch torchvision --index-url https://download.pytorch.org/whl/cu128

因为官网目前还没有12.9的轮子,所以用下面这条指令:

|---------------|---------------|
| CUDA 12.1 | CUDA 11.8 |

复制代码
pip install torch==2.1.0 torchvision==0.16.0 --index-url https://download.pytorch.org/whl/cu121
python 复制代码
pip install torch==2.1.0 torchvision==0.16.0 --index-url https://download.pytorch.org/whl/cu118

最后我选用了这个:

python 复制代码
pip install torch==2.2.0 torchvision==0.17.0 --index-url https://download.pytorch.org/whl/cu118

注意:

  • 官方 CUDA wheel 即可,conda cudatoolkit 会自动被 PyTorch 动态链接,无需额外装。

  • 版本号与 D-FINE 代码兼容,2.1.0 是目前最稳的"万金油"。

装完再验证:

python 复制代码
python -c "import torch, torchvision, platform; print('Python', platform.python_version()); print('Torch', torch.__version__); print('CUDA available', torch.cuda.is_available()); print('cuDNN', torch.backends.cudnn.version())"

现在看到:

python 复制代码
Python 3.12.11
Torch 2.2.0+cu118
CUDA available True
cuDNN 8700

同时有警告:

PyTorch 2.2.0 是用 NumPy 1.x 编译的 ,而你环境里现在是 NumPy 2.2.6 ,ABI 不兼容,导致 PyTorch 在 import 时报 _ARRAY_API not found 的警告(目前只是警告,但随时可能崩)。


✅ 最稳解决方案:把 NumPy 降级到 1.x

python 复制代码
pip install "numpy<2" --force-reinstall

执行完这条语句后验证:

python 复制代码
python -c "import numpy, torch; print('NumPy', numpy.__version__); print('Torch', torch.__version__)"
python 复制代码
NumPy 1.26.4
Torch 2.2.0+cu118

完美!

现在 NumPy 1.26.4 + PyTorch 2.2.0+cu118 已兼容,警告消失,GPU 也能正常调用。

此时第一步,即虚拟环境已经配备完成。

  • Python 3.12 + PyTorch 2.2.0+cu118 + NumPy 1.26 兼容

  • GPU 可被 torch 调用(CUDA True,cuDNN 8700)

二.下载权重并且运行demo:

  1. 下载权重

    官方 GitHub Release 页面:
    https://github.com/Peterande/D-FINE/releases

    dfine_swin_tiny.pth(最小、最快),放到项目根目录即可。

未完待续。。。

相关推荐
小途软件2 小时前
用于机器人电池电量预测的Sarsa强化学习混合集成方法
java·人工智能·pytorch·python·深度学习·语言模型
哥布林学者2 小时前
吴恩达深度学习课程五:自然语言处理 第一周:循环神经网络 (五)门控循环单元 GRU
深度学习·ai
薛不痒3 小时前
深度学习之优化模型(数据预处理,数据增强,调整学习率)
深度学习·学习
棒棒的皮皮5 小时前
【深度学习】YOLO模型速度优化Checklist
人工智能·深度学习·yolo·计算机视觉
AI街潜水的八角6 小时前
基于Pytorch深度学习神经网络MNIST手写数字识别系统源码(带界面和手写画板)
pytorch·深度学习·神经网络
资深web全栈开发8 小时前
深度对比 LangChain 8 种文档分割方式:从逻辑底层到选型实战
深度学习·自然语言处理·langchain
540_5408 小时前
ADVANCE Day45
人工智能·python·深度学习
云和数据.ChenGuang8 小时前
人工智能实践之基于CNN的街区餐饮图片识别案例实践
人工智能·深度学习·神经网络·机器学习·cnn
纪伊路上盛名在8 小时前
如何为我们的GPU设备选择合适的CUDA版本和Torch版本?
pytorch·深度学习·torch·cuda·英伟达
小途软件8 小时前
ssm327校园二手交易平台的设计与实现+vue
java·人工智能·pytorch·python·深度学习·语言模型