huggingface/bert/transformer的模型默认下载路径以及自定义路径

当使用 BertTokenizer.from_pretrained('bert-base-uncased') 加载预训练的 BERT 模型时,Hugging Face 的 transformers 库会从 Hugging Face Model Hub 下载所需的模型文件和分词器文件(如果它们不在本地缓存中)。

默认情况下,这些文件会被下载到本地的缓存目录中。缓存目录具体位置因您的操作系统和环境不同,但通常是以下路径之一:

默认缓存目录

  1. Linux / Unix / macOS

    • 默认路径:~/.cache/huggingface/transformers
    • 其中,~ 代表您的用户主目录。
  2. Windows

    • 默认路径:C:\Users\<YourUserName>\.cache\huggingface\transformers

自定义缓存路径

如果由于某些原因您需要更改默认的缓存路径,可以通过设置环境变量 TRANSFORMERS_CACHE 来指定新的路径。例如,在命令行中设置:

bash 复制代码
export TRANSFORMERS_CACHE=/your/custom/path

或者在 Python 代码中动态设置:

python 复制代码
import os
os.environ['TRANSFORMERS_CACHE'] = '/your/custom/path'

检查文件的具体位置

我们可以通过简单的脚本检查缓存路径和下载的文件:

python 复制代码
from transformers import BertTokenizer

# 检查默认的缓存路径
import os
cache_path = os.path.join(os.path.expanduser("~"), ".cache", "huggingface", "transformers")
print(f"Default cache path: {cache_path}")

# 加载分词器,触发下载(如果尚未下载)
tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')

# 列出缓存目录中的文件
for root, dirs, files in os.walk(cache_path):
    for file in files:
        print(os.path.join(root, file))

通过该脚本,可以确认默认的缓存路径,并列出缓存目录中的文件,确保模型和分词器成功下载。

相关推荐
天宝耐特3 小时前
赣江之上,SLAM“智”扫跨江桥梁,灵光L2Pro精准守护赣江南昌段通航安全
人工智能·三维激光扫描技术·天宝耐特·航道测绘·灵光l2pro手持扫描仪·其域创新·slam应用
YuanDaima20483 小时前
解决Conda环境下RTX 50系列显卡PyTorch+Transformers+PEFT微调报错
人工智能·pytorch·笔记·python·深度学习·机器学习·conda
俊哥V3 小时前
AI一周事件 · 2026-03-25 至 2026-03-31
人工智能·ai
-Da-3 小时前
【ai应用开发日记】通用未注入Bean AI提示词
java·数据库·人工智能·spring boot·sqlserver
憨波个3 小时前
【说话人日志】从 BLSTM 到 Self-Attention:SA-EEND
人工智能·transformer·音频·语音识别
清空mega3 小时前
动手学深度学习——多输入多输出通道详解:卷积为什么能越卷越“厚”?
人工智能
饼干哥哥3 小时前
9000字落地实操:AI做用户购后评论洞察分析
人工智能
饼干哥哥3 小时前
我的Vibe Marketing实践案例:如何用AI工作流驱动小红书矩阵,实现7位数营收
人工智能
Mintopia3 小时前
一套能落地的“干净代码”习惯:不用学架构也能用
人工智能
Mintopia3 小时前
新手最容易误解的计算机常识:一次讲清楚
人工智能