如何快速下载Huggingface上的超大模型,不用梯子,以Deepseek-R1为例子

就在昨天DeepSeek-R1模型问世即爆火,37B的大模型,你想部署一下试试吗?我就想试试,毕竟本人有8卡A100可以玩。

首先我们需要从Huggingface下载模型权重,我在国内,文件太大了,下载不了。有方法,有教程,请仔细看。

模型地址:https://huggingface.co/deepseek-ai/DeepSeek-R1/tree/main

下载工具:https://gist.github.com/padeoe/697678ab8e528b85a2a7bddafea1fa4f

1. 安装下载工具。

bash 复制代码
# 设置镜像地址
export HF_ENDPOINT="https://hf-mirror.com"
# 创建模型下载存放路径
mkdir model_download
# 进入该目录
cd model_download
# 下载所需的脚本
wget 

https://gist.githubusercontent.com/padeoe/697678ab8e528b85a2a7bddafea1fa4f/raw/3ed815fdcef9a30bd985772ab95ca57801c80bfa/hfd.sh
# 修改文件的执行权限
chmod a+x hfd.sh
# 注册执行命令
alias hfd="$PWD/hfd.sh"

2. 下载模型

bash 复制代码
hfd deepseek-ai/DeepSeek-R1 --tool wget

如果不指定参数 --tool wget,会报如下错误, 建议加上 --tool wget:

bash 复制代码
aria2c is not installed. Please install it first.

如果你想用aria2进行下载,难么你需要安装aria2。

bash 复制代码
sudo apt update

sudo apt install aria2

我分别都体验了,感觉aria2更好用。

相关推荐
gis分享者1 小时前
AI数字营销实测体验,GEO效果查询功能体验
人工智能·csdn·geo·数字营销·实测体验·效果查询
莱歌数字1 小时前
轻出20%性能:三维拓扑优化如何重塑无人机电子设备散热格局
人工智能·科技·制造·cae·散热
猿小猴子2 小时前
主流 AI IDE 之一的「DeepSeek-Reasonix 」介绍
人工智能·ai·deepseek·reasonix
装不满的克莱因瓶2 小时前
链式法则如何传递参数误差 —— 深入理解神经网络中的梯度传播
人工智能·python·深度学习·神经网络·数学·机器学习·ai
Anastasiozzzz2 小时前
从有限状态机到智能体图:传统 FSM 与 Agent Graph的演进
java·人工智能·python·ai
程序员cxuan7 小时前
为每个任务配一套 harness:Claude Code 里的动态工作流
人工智能
程序员cxuan8 小时前
Claude Fable 5 来了
人工智能·后端·程序员
云边云科技_云网融合8 小时前
云边云科技亮相 2026 WOD 制造业数智化博览会 云网融合赋能制造焕新
人工智能·科技·安全·制造
Σίσυφος19008 小时前
激光三角 光平面标定-多高度误差分析
人工智能·计算机视觉·平面
JS菌8 小时前
手写一个 AI Agent 全栈项目:从沙箱执行到子智能体的完整实现
前端·人工智能·后端