llama.cpp 转化 huggingface 模型失败 解决路径

问题:

./main -m ./models/book_q4_K_M -n 128

报错:

terminate called after throwing an instance of 'std::out_of_range' what(): unordered_map::at

解决方案:

python convert.py models/llama3-8B/ --vocab-type bpe

报错:

Found vocab files: {'spm': None, 'bpe': PosixPath('models/llama3-8B/vocab.json'), 'hfft': PosixPath('models/llama3-8B/tokenizer.json')} Loading vocab file PosixPath('models/llama3-8B/vocab.json'), type 'bpe' Vocab info: <BpeVocab with 128000 base tokens and 256 added tokens> Special vocab info: <SpecialVocab with 280147 merges, special tokens {'bos': 128000, 'eos': 128009, 'pad': 128009}, add special tokens unset>

复制代码
 (py310) root@quin-ubuntu:~/code/llama.cpp# ls models/llama3-8B/
 config.json             LICENSE                           model-00003-of-00004.safetensors  README.md                tokenizer.json
 generation_config.json  model-00001-of-00004.safetensors  model-00004-of-00004.safetensors  special_tokens_map.json
 ggml-model-f16.gguf     model-00002-of-00004.safetensors  model.safetensors.index.json      tokenizer_config.json

发现没有 vocab.json 文件

复制 token.json 重命名为 vocab.json

vocab.jsontokenizer.json 都是与自然语言处理模型中的令牌器(tokenizer)相关的配置文件,但它们包含的信息和用途可能有所不同。

  1. vocab.json:

    • 这个文件通常包含了模型的词汇表(vocabulary),即模型能够理解和生成的所有单词或子词单元的列表。

    • 词汇表文件可能包括每个词汇条目的索引、词汇本身以及相关的统计信息(如频率)。

    • 在基于BPE(Byte Pair Encoding)或其他子词分割算法的令牌器中,vocab.json 文件可能包含了所有合并操作(merges)的列表,这些合并操作定义了如何将字符组合成子词单元。

  2. tokenizer.json:

    • 这个文件可能包含了令牌器的完整配置,包括词汇表、特殊令牌(如[CLS]、[SEP]、[UNK]等)、分割规则、预处理和后处理步骤等。

    • 在某些框架或模型中,tokenizer.json 可能是一个更全面的配置文件,它不仅包含了词汇表信息,还可能包括了如何将文本转换为模型输入的详细说明。

    • 这个文件可能用于保存和加载令牌器的配置,以便在不同的环境中重用相同的令牌化过程。

在实际应用中,vocab.jsontokenizer.json 的具体内容和格式可能取决于所使用的框架和模型。例如,在Hugging Face的Transformers库中,tokenizer.json 文件通常包含了令牌器的所有配置信息,而 vocab.json 可能只是词汇表的一部分。

如果你遇到需要使用这些文件的情况,你应该查阅相关模型或框架的文档,以确保你理解每个文件的确切用途和内容,并正确地使用它们。如果你的模型或脚本期望找到 vocab.json 文件,但你只有 tokenizer.json,你可能需要检查这两个文件是否可以互换,或者是否需要对脚本进行调整以适应现有的文件。

复制代码
 cp models/llama3-8B/tokenizer.json  models/llama3-8B/vocab.json

重新转换:

复制代码
 # 转换模型
 python convert.py models/llama3-8B/ --vocab-type bpe
 ​
 # 量化模型
 ./quantize models/llama3-8B/ggml-model-f32.gguf ./models/book-Q4_K_M.gguf Q4_K_M
 ​
 # 运行模型
 ./main -m ./models/book-Q4_K_M.gguf -n 128
相关推荐
ibrahim5 小时前
Llama 3.2 900亿参数视觉多模态大模型本地部署及案例展示
ai·大模型·llama·提示词
算力魔方AIPC8 小时前
Meta重磅发布Llama 3.3 70B:开源AI模型的新里程碑
人工智能·llama
威化饼的一隅10 小时前
【多模态】swift-3框架使用
人工智能·深度学习·大模型·swift·多模态
伯牙碎琴13 小时前
智能体实战(需求分析助手)二、需求分析助手第一版实现(支持需求提取、整理、痛点分析、需求分类、优先级分析、需求文档生成等功能)
ai·大模型·agent·需求分析·智能体
聆思科技AI芯片15 小时前
实操给桌面机器人加上超拟人音色
人工智能·机器人·大模型·aigc·多模态·智能音箱·语音交互
zaim11 天前
计算机的错误计算(一百八十七)
人工智能·ai·大模型·llm·错误·正弦/sin·误差/error
Engineer-Yao1 天前
【win10+RAGFlow+Ollama】搭建本地大模型助手(教程+源码)
docker·大模型·win10·wsl·ollama·本地大模型·ragflow
三月七(爱看动漫的程序员)2 天前
LEAST-TO-MOST PROMPTING ENABLES COMPLEX REASONING IN LARGE LANGUAGE MODELS---正文
人工智能·gpt·学习·机器学习·语言模型·自然语言处理·llama
AI程序猿人2 天前
三种Transformer模型中的注意力机制介绍及Pytorch实现:从自注意力到因果自注意力
人工智能·pytorch·深度学习·自然语言处理·大模型·transformer·llms
码狂☆2 天前
源码编译llama.cpp for android
android·人工智能·llama