如何将 huggingface上的模型文件下载到本地

写在前面

缘由:国内的GPU服务器直接调取 huggingface 上模型经常会失败,因此下载到本地就能免去许多麻烦。

方法三基于知乎上一位博主所提出方法的基础上进行改进,可以将huggingface上模型由 Colab 存进 谷歌云盘 或者 百度云盘。特别是有些国内炼丹平台支持百度网盘,所以你甚至可以直接将百度网盘内的文件直接上传到炼丹平台,更省事了。

记得点赞收藏,下次还能找到!

写在中间

法一、直接下载

如果不嫌麻烦的话,可以直接下载单个文件或者目录里面的文件。

在此之前,在本地仿照仓库新建对应层级的文件夹,将每个文件放进对应目录即可。

法二:git 克隆仓库

这一种方法最为简单。

首先打开代理软件。

接着在电脑上安装好git,然后在你想下载的位置新建一个文件夹,进入文件夹之后,点击右键

然后设置代理,一行一行的复制粘贴,由于clash默认端口7890

Python 复制代码
# 设置全局代理
git config --global https.proxy http://127.0.0.1:7890
git config --global https.proxy https://127.0.0.1:7890
git config --global http.proxy socks5://127.0.0.1:7890
git config --global https.proxy socks5://127.0.0.1:7890

# 取消全局代理
git config --global --unset http.proxy
git config --global --unset https.proxy

之后进入huggingface找到你要下载的模型,点击图中位置即可获取克隆链接。复制到git,静待即可。

|---------------------------------------------------------------------------------------------------|---------------------------------------------------------------------------------------------------|
| | |

法三:借用 Colab 充当下载器

本方法基于知乎博主文章修改,由于使用原代码下载时,有时会出现错误,故将其修改并完善。关于使用方法,我已在下面的链接中将使用方法尽可能详细的说明,进入即可查看

使用链接

得益于colab 高达 200~300MB/s 的极高网速,可以十分轻松的拉取huggingface 上的代码模型文件。

经过实验,我已经帮大家踩过坑了,不要直接在 colab 中使用命令将文件夹压缩。由于没有优化,测试下来 8个G大小的模型文件经过压缩为5G,花费 20 分钟。而且由于文件过大,还不能直接下载下来。

因此可以将拉取过后的文件夹整个保存到云盘,就能发挥云盘下载文件的优势了。

具体方法:如果保存到谷歌云盘,进入谷歌云盘,找到刚刚保存的模型文件夹,点击下载,云盘就会将其压缩下载了。

可以看见一个最大的bin模型文件被单独下载且不需要解压,其余文件被分成两部分,注意解压文件时,将其解压到同一个文件夹内。经过整理同样可以完整下载

当然也可以根据提示保存到百度网盘里面,速度也是相当可观的。

对接炼丹平台

来讲讲法三最牛的用法,前提是你有百度网盘会员,如果要使用云 GPU 来进行训练上传模型到国内的炼丹平台,由于我只用过 autodl 这家(其他家的如果可以欢迎在评论区补充)是支持公网网盘导入和导出的。教程在这里,所以可以将上一步存到网盘里的文件直接导入进autodl。

写在最后

总结一下

👍🏻点赞,你的认可是我创作的动力!

⭐收藏,你的青睐是我努力的方向!

✏️评论,你的意见是我进步的财富!

相关推荐
开开心心就好20 小时前
免费无广告卸载工具,轻便安全适配全用户
linux·运维·服务器·网络·安全·启发式算法·1024程序员节
开开心心就好2 天前
图片格式转换工具,右键菜单一键转换简化
linux·运维·服务器·python·django·pdf·1024程序员节
徐子童4 天前
网络协议---TCP协议
网络·网络协议·tcp/ip·面试题·1024程序员节
扫地的小何尚5 天前
NVIDIA RTX PC开源AI工具升级:加速LLM和扩散模型的性能革命
人工智能·python·算法·开源·nvidia·1024程序员节
数据皮皮侠AI6 天前
上市公司股票名称相似度(1990-2025)
大数据·人工智能·笔记·区块链·能源·1024程序员节
开开心心就好7 天前
系统清理工具清理缓存日志,启动卸载管理
linux·运维·服务器·神经网络·cnn·pdf·1024程序员节
Evan东少10 天前
[踩坑]笔记本Ubuntu20.04+NvidiaRTX5060驱动+cuda+Pytorch+ROS/Python实现人脸追踪(环境准备)
1024程序员节
不爱编程的小陈11 天前
C/C++每日面试题
面试·职场和发展·1024程序员节
开开心心就好11 天前
右键菜单管理工具,添加程序自定义名称位置
linux·运维·服务器·ci/cd·docker·pdf·1024程序员节
码农三叔12 天前
(4-2-05)Python SDK仓库:MCP服务器端(5)Streamable HTTP传输+Streamable HTTP传输
开发语言·python·http·大模型·1024程序员节·mcp·mcp sdk