NLP学习与踩坑记录(持续更新版)

NLP学习与踩坑记录(持续更新版)

  • [OSError: Can't load tokenizer for 'bert-base-uncased'.](#OSError: Can't load tokenizer for 'bert-base-uncased'.)
  • [google.protobuf.message.DecodeError: Error parsing message](#google.protobuf.message.DecodeError: Error parsing message)
  • Deepspeed

本博客记录了博主在学习NLP时遇到了各种各样的问题与解决方法,供大家参考,希望踩过的坑不踩第二次!

OSError: Can't load tokenizer for 'bert-base-uncased'.

python 复制代码
tokenizer = BertTokenizer.from_pretrained("bert-base-uncased", truncation_side=truncation_side)

博主在调用上述代码时出现此报错,原因是在国内因为网络问题无法下载huggingface上的模型。

解决办法一:检查自己的网络,在国内需要使用VPN保证可以访问huggingface,然后重新运行代码。若不行,将模型下载到本地,再重新运行代码。

bash 复制代码
huggingface-cli download --resume-download google-bert/bert-base-cased --local-dir /home/user/bert-base-cased

解决办法二:使用modelscope上的镜像,速度较快,但可能存在一些huggingface上的模型modelscope上没有。

python 复制代码
# pip install modelscope
from modelscope.hub.snapshot_download import snapshot_download
llm = snapshot_download('AI-ModelScope/bert-base-uncased')
tokenizer = BertTokenizer.from_pretrained(llm, truncation_side=truncation_side)

解决办法三:Colab下载转移至Google Drive上,再从Google Drive上下载。

google.protobuf.message.DecodeError: Error parsing message

原因是通过git clone命令直接下载,并没有下载到正确的模型参数文件,只是一个文本文档,解决方法是下载huggingface上的模型需要使用huggingface-cli工具。

bash 复制代码
# 错误的下载方式
git clone https://huggingface.co/bert-base-uncased
# 正确的下载方式
pip install huggingface_hub
huggingface-cli download --resume-download [model_name] --local-dir [local path] 
# eg: huggingface-cli download --resume-download google-bert/bert-base-cased --local-dir /home/user/

Deepspeed

相关推荐
佛州小李哥6 天前
利用亚马逊AI代码助手生成、构建和编译一个游戏应用(下)
人工智能·科技·ai·开发·aws·代码·亚马逊云科技
艾策第三方软件测评7 天前
审计费用差10倍?项目规模如何影响报价
代码·报价·审计
程序员鱼皮9 天前
用 DeepSeek 给对象做个网站,她一定感动坏了
计算机·ai·程序员·互联网·网站·代码
WPG大大通18 天前
教程 | i.MX RT1180 ECAT_digital_io DEMO 搭建(一)
经验分享·笔记·硬件工程·开发·代码·大大通
非凡的世界25 天前
wordpress代码结构解析
解析·wordpress·代码
程序员鱼皮1 个月前
我干了两个月的大项目,开源了!
计算机·程序员·软件开发·代码·自学编程
智在碧得2 个月前
前端Monorepo实践分享
前端·代码仓库·monorepo·代码·业务组件
sdaxue.com2 个月前
帝国cms电脑pc站url跳转到手机站url的方法
网站·代码·帝国cms·手机站·站长
程序员鱼皮2 个月前
第一次参加实习,我祛魅了!
后端·计算机·互联网·软件开发·求职·代码·编程经验
网络研究院3 个月前
对 JavaScript 说“不”
开发语言·javascript·typescript·ecmascript·编程·代码