decapoda-research/llama-7b-hf 的踩坑记录

使用transformers加载decapoda-research/llama-7b-hf的踩坑记录。

  1. ValueError: Tokenizer class LLaMATokenizer does not exist or is not currently imported.

    解决办法:

    https://github.com/huggingface/transformers/issues/22222

    将tokenizer_config.json中LLaMATokenizer改为LlamaTokenizer。

  2. RecursionError: maximum recursion depth exceeded while getting the str of an object.

    解决办法:

    https://github.com/huggingface/transformers/issues/22762

    使用tokenizer_config.json替换原本的tokenizer_config.json

相关推荐
CHPCWWHSU1 天前
初识llama.cpp - 轻量级推理引擎
llm·llama·cpp·cudatoolkit
l1t1 天前
在ARM64 KyLin计算机上安装llama.cpp
大数据·llama·kylin
l1t1 天前
在华为arm64 kylin计算机上安装docker编译llama.cpp的步骤
华为·docker·llama·kylin
小超同学你好2 天前
Transformer 12. LLaMA 架构介绍以及与 Transformer 架构对比
人工智能·语言模型·transformer·llama
l1t2 天前
在Windows11利用llama.cpp调用Qwen3.5量化模型测试
人工智能·llama·qwen
HyperAI超神经2 天前
在线教程丨免费CPU资源快速部署,覆盖Qwen3.5/DeepSeek-R1/Gemma 3/Llama 3.2等热门开源模型
人工智能·深度学习·学习·机器学习·ai编程·llama·vllm
乾元2 天前
本地大模型:如何在内网部署 Llama/Qwen 等安全增强模型
运维·网络·人工智能·安全·机器学习·llama·安全架构
jialan752 天前
llama-cli 核心命令详解
llama
Thomas.Sir2 天前
Qwen2:阿里开源大模型理论剖析以及本地部署实战
开源·llama·qwen2·ai 大模型
l1t2 天前
在Android设备上利用Termux安装llama.cpp并启动webui
android·llama