OSError: Can‘t load tokenizer for ‘bert-base-uncased‘.

一、具体报错:

报错如下:
OSError: Can't load tokenizer for 'bert-base-uncased'. If you were trying to load it from 'https://huggingface.co/models', make sure you don't have a local directory with the same name. Otherwise, make sure 'bert-base-uncased' is the correct path to a dir

二、报错原因:

模型调用bert时,由于huggingface有墙导致模型无法下载

三、 解决方法:

1、通过镜像站下载

直接命令行通过huggingface镜像运行脚本,从而下载对应bert模型权重
HF_ENDPOINT=https://hf-mirror.com python 模型脚本.py

与之相同,通过设置环境变量也可以,以linux为例
export HF_ENDPOINT=https://hf-mirror.com

2、直接下载权重

地址https://huggingface.co/google-bert/bert-base-uncased/tree/main
镜像地址https://hf-mirror.com/google-bert/bert-base-uncased/tree/main
下载内容

xml 复制代码
config.json
pytorch_model.bin
tokenizer.json
tokenizer_config.json
vocab.txt

将对应文件放入一个文件夹内,如bert-base-uncased;查看报错所在的文件具体位置,以及对应引用模型的位置


tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')

from_pretrained()中的内容换成模型所在文件夹的路径,建议填写绝对路径
tokenizer = BertTokenizer.from_pretrained('./bert-base-uncased')

相关推荐
chen_song_几秒前
深度神经网络训练参数优化概论
人工智能·深度学习·神经网络·机器学习·dnn
java1234_小锋1 分钟前
Transformer 大语言模型(LLM)基石 - Transformer架构详解 - 输入嵌入层(Input Embeddings)详解以及算法实现
深度学习·语言模型·transformer
大模型真好玩1 分钟前
轻松搞定年度报告可视化,五分钟用 AntV + Trae Solo 快速构建智能图表生成器!
前端·人工智能·trae
非著名架构师1 分钟前
智慧城市的“气候大脑“:气象大数据如何优化城市级能源调度与供需平衡
大数据·人工智能·数据分析·智慧城市·风光功率预测·高精度天气预报数据
程序猿编码2 分钟前
用 C++ 玩转字符级 Transformer 语言模型:从原理到实现
开发语言·c++·深度学习·语言模型·transformer
doris6102 分钟前
制造企业如何实现设备全生命周期管理?
大数据·网络·人工智能
却道天凉_好个秋2 分钟前
OpenCV(四十):Shi-Tomasi角点检测
人工智能·opencv·计算机视觉
jllllyuz3 分钟前
基于极限学习机(ELM)的数据分类:原理、实现与优化
人工智能·分类·数据挖掘
moonsheeper5 分钟前
Prompt优化策略
人工智能·机器学习
海岸线科技5 分钟前
离散制造,工单级成本管控的必然
大数据·人工智能·制造