程序员转行学习 AI 大模型: 踩坑记录,HuggingFace镜像设置未生效

本文是程序员转行学习AI大模型的踩坑记录分享。

当前阶段:还在学习知识点,由点及面,从 0 到 1 搭建 AI 大模型知识体系中。

系列更新,关注我,后续会持续记录分享转行经历~

设置镜像站

在项目代码中,打开终端,按照如下步骤,设置 HuggingFace 镜像站:

  1. 查看当前环境
plain 复制代码
echo $HF_ENDPOINT

如果,输出为空,则说明还没有设置镜像站。

  1. 设置 HuggingFace 镜像站
plain 复制代码
export HF_ENDPOINT=https://hf-mirror.com

使用 HF-Mirror 镜像站。

  1. 验证设置是否成功
plain 复制代码
echo $HF_ENDPOINT

如果输出:https://hf-mirror.com,则设置镜像站成功。

  1. 永久设置镜像站(可选)

如果希望每次打开终端,都自动使用镜像站,可以添加到 shell 配置文件中。

plain 复制代码
echo 'export HF_ENDPOINT=https://hf-mirror.com' >> ~/.bashrc
source ~/.bashrc

同样,执行以下命令,验证是否成功。

plain 复制代码
echo $HF_ENDPOINT
  1. 测试镜像站是否生效

输入以下脚本命令,验证镜像站是否正常工作:

plain 复制代码
python -c "from huggingface_hub import hf_hub_download; print(hf_hub_download('Qwen/Qwen1.5-0.5B', 'config.json'))"

如果下载成功,则镜像站设置正确。

  1. 恢复官方源(如有需要)

如果想恢复到官方源,可以取消设置:

plain 复制代码
unset HF_ENDPOINT

或者删除配置文件中的设置:

plain 复制代码
# 对于 Bash
sed -i '/HF_ENDPOINT/d' ~/.bashrc

# 对于 Zsh
sed -i '/HF_ENDPOINT/d' ~/.zshrc

常用 huggingface 镜像站

镜像站 地址
HF-Mirror https://hf-mirror.com
ModelScope https://modelscope.cn

踩坑:镜像站设置成功,但代码仍去官网链接下载

我在项目中,按照上述步骤成功设置了HF-Mirror 镜像站,但是执行代码时,一直还是去官网下载,报错如下:

plain 复制代码
'[Errno 101] Network is unreachable' thrown while requesting HEAD https://huggingface.co/Qwen/Qwen1.5-0.5B/resolve/main/tokenizer_config.json

程序还是试图访问huggingface.io(官方源)。

后面发现,是因为我的项目还是缓存了旧的环境变量,因此没有生效。

解决方案:

  1. 清楚 HuggingFace 缓存

删除缓存目录:

plain 复制代码
rm -rf ~/.cache/huggingface/

然后,执行代码,就可以正常读取新环境变量。

  1. 在代码中显示设置 endpoint

在代码中,添加以下部分:

python 复制代码
import os

# 设置Hugging Face镜像站(必须在导入库之前设置)
os.environ['HF_ENDPOINT'] = 'https://hf-mirror.com'

按照上述操场,可以正常去镜像站下载模型和数据了。

相关推荐
DR5647几秒前
【无标题】
人工智能
小江的记录本1 分钟前
【Spring AI】Spring AI中RAG误触发与系统提示词泄露问题解决方案(完整版+代码方案)
java·人工智能·spring boot·后端·python·spring·面试
落叶无情2 分钟前
第一章 ICEF框架的核心理念与结构设计
人工智能
勇往直前plus9 分钟前
Python 属性访问与操作全解析:内置函数、魔法方法与描述符深度指南
java·网络·python
古月开发15 分钟前
旧手机变身 AI 作业监督器:低成本家庭学习解决方案
人工智能·学习·智能手机
Arenaschi15 分钟前
关于GPT的版特点
java·网络·人工智能·windows·python·gpt
大江东去浪淘尽千古风流人物17 分钟前
【HaMeR】全Transformer架构的单目3D手部网格重建:ViT-H骨干+跨注意力MANO解码器源码深度解析
深度学习·3d·transformer·vit·手部重建·mano
邂逅and回眸18 分钟前
AI Agent 四大核心模块深度拆解:ReAct、Planning、Memory 与 Tool Use
人工智能
陕西企来客20 分钟前
陕西旅游酒店 GEO 服务市场深度调查:AI 搜索优化格局与真实服务真相
大数据·人工智能·旅游
薛定猫AI23 分钟前
【深度解析】Hermes Agent Velocity Release:长期记忆、自进化技能与多智能体任务编排实践
网络·人工智能