如何快速下载Huggingface上的超大模型,不用梯子,以Deepseek-R1为例子

就在昨天DeepSeek-R1模型问世即爆火,37B的大模型,你想部署一下试试吗?我就想试试,毕竟本人有8卡A100可以玩。

首先我们需要从Huggingface下载模型权重,我在国内,文件太大了,下载不了。有方法,有教程,请仔细看。

模型地址:https://huggingface.co/deepseek-ai/DeepSeek-R1/tree/main

下载工具:https://gist.github.com/padeoe/697678ab8e528b85a2a7bddafea1fa4f

1. 安装下载工具。

bash 复制代码
# 设置镜像地址
export HF_ENDPOINT="https://hf-mirror.com"
# 创建模型下载存放路径
mkdir model_download
# 进入该目录
cd model_download
# 下载所需的脚本
wget 

https://gist.githubusercontent.com/padeoe/697678ab8e528b85a2a7bddafea1fa4f/raw/3ed815fdcef9a30bd985772ab95ca57801c80bfa/hfd.sh
# 修改文件的执行权限
chmod a+x hfd.sh
# 注册执行命令
alias hfd="$PWD/hfd.sh"

2. 下载模型

bash 复制代码
hfd deepseek-ai/DeepSeek-R1 --tool wget

如果不指定参数 --tool wget,会报如下错误, 建议加上 --tool wget:

bash 复制代码
aria2c is not installed. Please install it first.

如果你想用aria2进行下载,难么你需要安装aria2。

bash 复制代码
sudo apt update

sudo apt install aria2

我分别都体验了,感觉aria2更好用。

相关推荐
羽凌寒几秒前
动态范围调整(SEF算法实现)
人工智能·深度学习·计算机视觉
zyhomepage11 分钟前
科技的成就(六十八)
开发语言·人工智能·科技·算法·内容运营
数据库安全11 分钟前
美创科技针对《银行保险机构数据安全管理办法》解读
大数据·人工智能·产品运营
king of code porter38 分钟前
深度学习之用CelebA_Spoof数据集搭建一个活体检测-训练好的模型用MNN来推理
人工智能·深度学习·mnn
明明跟你说过1 小时前
掌握 LangChain 文档处理核心:Document Loaders 与 Text Splitters 全解析
人工智能·语言模型·自然语言处理·langchain
EasyDSS1 小时前
嵌入式EasyRTC音视频实时通话SDK在工业制造领域的智能巡检/AR协作等应用
人工智能·音视频
正在走向自律1 小时前
GpuGeek 网络加速:破解 AI 开发中的 “最后一公里” 瓶颈
网络·人工智能·python·机器学习·性能优化·gpugeek
正儿八经的数字经1 小时前
人工智能100问☞第24问:什么是生成对抗网络(GAN)?
人工智能·神经网络·生成对抗网络
wei_shuo2 小时前
GpuGeek 实操指南:So-VITS-SVC 语音合成与 Stable Diffusion 文生图双模型搭建,融合即梦 AI 的深度实践
人工智能·stable diffusion·gpu算力·gpuseek