关于llama2:从原始llama-2-7b到llama-2-7b-hf的权重转换教程

1.首先,我是从各个教程里面选了一个实际操作的教程(这样更加靠谱):下载llama2-7b并转hf模型_huggingface 下载llama2-7b-chat-hf-CSDN博客

2.但是,其实我在另外一篇更好的教程里面看到过一个坑(这篇好像是腾讯云的一篇文章但是找不到了呜呜呜~~~),这个没有列出来,不过我自己也试出来了,:

直接按照这个教程是可以的,但是需要注意,tokenizer.model文件需要在llama-2-7b这个目录里面有,所以我是复制过去了。

最终得到了我想要的hf版本的权重!

相关推荐
LucianaiB1 天前
使用GpuGeek高效完成LLaMA大模型微调:实践与心得分享
ai·llama·ai自动化·gpugeek
为啥全要学2 天前
LLaMA-Factory 微调 Qwen2-7B-Instruct
llama·大模型微调·llamafactory
一把年纪学编程2 天前
dify 连接不上ollama An error occurred during credentials validation:
llama
陈奕昆3 天前
五、【LLaMA-Factory实战】模型部署与监控:从实验室到生产的全链路实践
开发语言·人工智能·python·llama·大模型微调
fydw_7154 天前
大语言模型RLHF训练框架全景解析:OpenRLHF、verl、LLaMA-Factory与SWIFT深度对比
语言模型·swift·llama
AI大模型顾潇4 天前
[特殊字符] 本地部署DeepSeek大模型:安全加固与企业级集成方案
数据库·人工智能·安全·大模型·llm·微调·llama
modest —YBW5 天前
Ollama+OpenWebUI+docker完整版部署,附带软件下载链接,配置+中文汉化+docker源,适合内网部署,可以局域网使用
人工智能·windows·docker·语言模型·llama
青衫客365 天前
使用本地部署的 LLaMA 3 模型进行中文对话生成
大模型·llama
cainiao0806055 天前
《大模型微调实战:Llama 3.0全参数优化指南》
llama
鸿蒙布道师5 天前
英伟达开源Llama-Nemotron系列模型:14万H100小时训练细节全解析
深度学习·神经网络·opencv·机器学习·自然语言处理·数据挖掘·llama