huggingface/bert/transformer的模型默认下载路径以及自定义路径

当使用 BertTokenizer.from_pretrained('bert-base-uncased') 加载预训练的 BERT 模型时,Hugging Face 的 transformers 库会从 Hugging Face Model Hub 下载所需的模型文件和分词器文件(如果它们不在本地缓存中)。

默认情况下,这些文件会被下载到本地的缓存目录中。缓存目录具体位置因您的操作系统和环境不同,但通常是以下路径之一:

默认缓存目录

  1. Linux / Unix / macOS

    • 默认路径:~/.cache/huggingface/transformers
    • 其中,~ 代表您的用户主目录。
  2. Windows

    • 默认路径:C:\Users\<YourUserName>\.cache\huggingface\transformers

自定义缓存路径

如果由于某些原因您需要更改默认的缓存路径,可以通过设置环境变量 TRANSFORMERS_CACHE 来指定新的路径。例如,在命令行中设置:

bash 复制代码
export TRANSFORMERS_CACHE=/your/custom/path

或者在 Python 代码中动态设置:

python 复制代码
import os
os.environ['TRANSFORMERS_CACHE'] = '/your/custom/path'

检查文件的具体位置

我们可以通过简单的脚本检查缓存路径和下载的文件:

python 复制代码
from transformers import BertTokenizer

# 检查默认的缓存路径
import os
cache_path = os.path.join(os.path.expanduser("~"), ".cache", "huggingface", "transformers")
print(f"Default cache path: {cache_path}")

# 加载分词器,触发下载(如果尚未下载)
tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')

# 列出缓存目录中的文件
for root, dirs, files in os.walk(cache_path):
    for file in files:
        print(os.path.join(root, file))

通过该脚本,可以确认默认的缓存路径,并列出缓存目录中的文件,确保模型和分词器成功下载。

相关推荐
Anchenry几秒前
CoinTrail-智能Ai记账软件
人工智能·软件工程·软件需求
superantwmhsxx几秒前
ChatGPT Images 2.0 角色一致性实战:如何在多轮对话中保持人物形象统一
人工智能·chatgpt
悟乙己3 分钟前
在Netflix实现机器学习民主化:构建模型生命周期图
人工智能·机器学习
搬砖的小码农_Sky3 分钟前
AI大模型:什么是Token?
人工智能·ai·人机交互·agi
weixin_468466853 分钟前
神经网络模型评价指标新手实战指南
人工智能·神经网络·机器学习·scikit-learn·sklearn·评价指标·网络模型
luweis4 分钟前
企智孪生 ETA (3.5 执行层技术落地)【浙江联保网络 卢伟舜】
网络·人工智能·程序人生·职场和发展·学习方法
OpenVINO 中文社区5 分钟前
飞桨黑客松Intel赛道Meetup×Intel龙虾Skills城市巡回首场·上海站
人工智能·openvino·英特尔
手写码匠5 分钟前
华为云Flexus+DeepSeek征文|万字实战:MaaS 推理服务 + Dify 高可用部署 + AI Agent 开发全流程
人工智能·深度学习·算法·aigc
zhangfeng11336 分钟前
tesla P100显卡使用体验&AI部署小结
人工智能
OpenCSG8 分钟前
OpenCSG全程赋能2026 WAIC Future Tech OPC 先锋挑战赛:以开放AI平台助力“全民Agent创业时代”
人工智能·开源·opencsg·waic