记录一次深度学习+SSH的配置

太久没碰深度学习了...全忘了主包重新来吧,自用。

参考:D-FINE安装部署全攻略:从环境配置到模型推理完整流程-CSDN博客

一.本次配置的是dfine模型的环境:

在Vscode+远程上训练:


一.首先anaconda创建一个专属的虚拟环境:

python 复制代码
#创建虚拟环境 
conda create -n dfine python=3.12
conda activate dfine
 
# 安装核心依赖
pip install torch>=2.0.1 torchvision>=0.15.2 -i https://pypi.tuna.tsinghua.edu.cn/simple

pip install faster-coco-eval>=1.6.6 PyYAML tensorboard scipy
pip install calflops transformers loguru
python 复制代码
# ONNX相关工具
pip install onnx onnxsim onnxruntime
 
# TensorRT部署(需要CUDA环境)
pip install tensorrt
 
# OpenVINO部署  
pip install openvino
 
# 可视化工具
pip install fiftyone

-i https://pypi.tuna.tsinghua.edu.cn/simple

去网站:D-FINE:D-FINE: Redefine Regression Task of DETRs as Fine-grained Distribution Refinement 💥💥💥 - GitCode

点击clone。

python 复制代码
cd D-FINE

//cd到刚刚clone的zip目录里,然后:
pip install -r requirements.txt

到这一步,接下来:验证

  1. PyTorch 能否调用 GPU(CUDA 路径正确否)
python 复制代码
python -c "import torch, platform, cv2; print('Python', platform.python_version()); print('Torch', torch.__version__); print('CUDA available', torch.cuda.is_available()); print('cuDNN ver', torch.backends.cudnn.version())"

结果是:

python 复制代码
Python 3.12.11
Torch 2.8.0+cpu
CUDA available False
cuDNN ver None

说明:你装的是 CPU 版 PyTorch ,所以 CUDA/cuDNN 全是 None。

在 D-FINE 里训练或大图推理会很慢,必须换成 GPU 版 wheel

因此我们需要:

两步切到 GPU 版(保持清华源加速)

你装的是 CPU 版 PyTorch ,所以 CUDA/cuDNN 全是 None。

在 D-FINE 里训练或大图推理会很慢,必须换成 GPU 版 wheel


两步切到 GPU 版(保持清华源加速)

  1. 先卸载 CPU 版

    pip uninstall -y torch torchvision

2.按你的驱动版本选一条命令(驱动 ≥ 525 就用 CUDA 12,否则用 11.8):

这里通过命令:查看自己的cuda版本,我的是12.9.

python 复制代码
nvidia-smi

接下来去PyTorch

python 复制代码
pip3 install torch torchvision --index-url https://download.pytorch.org/whl/cu128

因为官网目前还没有12.9的轮子,所以用下面这条指令:

|---------------|---------------|
| CUDA 12.1 | CUDA 11.8 |

复制代码
pip install torch==2.1.0 torchvision==0.16.0 --index-url https://download.pytorch.org/whl/cu121
python 复制代码
pip install torch==2.1.0 torchvision==0.16.0 --index-url https://download.pytorch.org/whl/cu118

最后我选用了这个:

python 复制代码
pip install torch==2.2.0 torchvision==0.17.0 --index-url https://download.pytorch.org/whl/cu118

注意:

  • 官方 CUDA wheel 即可,conda cudatoolkit 会自动被 PyTorch 动态链接,无需额外装。

  • 版本号与 D-FINE 代码兼容,2.1.0 是目前最稳的"万金油"。

装完再验证:

python 复制代码
python -c "import torch, torchvision, platform; print('Python', platform.python_version()); print('Torch', torch.__version__); print('CUDA available', torch.cuda.is_available()); print('cuDNN', torch.backends.cudnn.version())"

现在看到:

python 复制代码
Python 3.12.11
Torch 2.2.0+cu118
CUDA available True
cuDNN 8700

同时有警告:

PyTorch 2.2.0 是用 NumPy 1.x 编译的 ,而你环境里现在是 NumPy 2.2.6 ,ABI 不兼容,导致 PyTorch 在 import 时报 _ARRAY_API not found 的警告(目前只是警告,但随时可能崩)。


✅ 最稳解决方案:把 NumPy 降级到 1.x

python 复制代码
pip install "numpy<2" --force-reinstall

执行完这条语句后验证:

python 复制代码
python -c "import numpy, torch; print('NumPy', numpy.__version__); print('Torch', torch.__version__)"
python 复制代码
NumPy 1.26.4
Torch 2.2.0+cu118

完美!

现在 NumPy 1.26.4 + PyTorch 2.2.0+cu118 已兼容,警告消失,GPU 也能正常调用。

此时第一步,即虚拟环境已经配备完成。

  • Python 3.12 + PyTorch 2.2.0+cu118 + NumPy 1.26 兼容

  • GPU 可被 torch 调用(CUDA True,cuDNN 8700)

二.下载权重并且运行demo:

  1. 下载权重

    官方 GitHub Release 页面:
    https://github.com/Peterande/D-FINE/releases

    dfine_swin_tiny.pth(最小、最快),放到项目根目录即可。

未完待续。。。

相关推荐
河南骏3 小时前
RAG_检索进阶
人工智能·深度学习
灯火不休时4 小时前
95%准确率!CNN交通标志识别系统开源
人工智能·python·深度学习·神经网络·cnn·tensorflow
xier_ran5 小时前
Transformer:Decoder 中,Cross-Attention 所用的 K(Key)和 V(Value)矩阵,是如何从 Encoder 得到的
深度学习·矩阵·transformer
2401_841495646 小时前
【自然语言处理】轻量版生成式语言模型GPT
人工智能·python·gpt·深度学习·语言模型·自然语言处理·transformer
笑脸惹桃花7 小时前
目标检测数据集——路面裂缝检测数据集
人工智能·深度学习·yolo·目标检测·计算机视觉·数据集
骥龙8 小时前
2.4、恶意软件猎手:基于深度学习的二进制文件判别
人工智能·深度学习·网络安全
hans汉斯8 小时前
【计算机科学与应用】基于BERT与DeepSeek大模型的智能舆论监控系统设计
大数据·人工智能·深度学习·算法·自然语言处理·bert·去噪
清风与日月10 小时前
halcon分类器使用标准流程
深度学习·目标检测·计算机视觉
西西阿西哥10 小时前
【随便聊聊】和ChatGPT聊聊潜空间
深度学习·chatgpt
CAD老兵11 小时前
量化技术:如何让你的 3D 模型和 AI 模型瘦身又飞快
人工智能·深度学习·机器学习