Llama中文大模型

关于Llama中文大模型

欢迎来到Llama中文大模型:已经基于大规模中文数据,从预训练开始对Llama2模型进行中文能力的持续迭代升级。

Llama中文大模型https://github.com/LlamaFamily/Llama-Chinese

在线体验https://llama.family

基于Llama2的开源中文预训练大模型Atom-7Bhttps://huggingface.co/FlagAlpha/Atom-7B-Chat​​​​​​​

Llama中文大模型

中文预训练模型Atom-7B

🔵 Atom大模型

原子大模型Atom由Llama中文社区和原子回声联合打造,在中文大模型评测榜单C-Eval中位居前十(8月21日评测提交时间)。

|------|--------------|------------------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 类别 | 模型名称 | 🤗模型加载名称 | 下载地址 |
| 预训练 | Atom-7B | FlagAlpha/Atom-7B | HuggingFace | ModelScope | WiseModel |
| Chat | Atom-7B-Chat | FlagAlpha/Atom-7B-Chat | HuggingFace | ModelScope | WiseModel |

Atom系列模型包含Atom-7B和Atom-13B,基于Llama2做了中文能力的持续优化。Atom-7B和Atom-7B-Chat目前已完全开源,支持商用,可在Hugging Face仓库:++https://huggingface.co/FlagAlpha++ 获取模型。

Llama2官方模型

|------|------------------------|--------------------------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 类别 | 模型名称 | 🤗模型加载名称 | 下载地址 |
| 预训练 | Llama2-7B | meta-llama/Llama-2-7b-hf | HuggingFace | 迅雷网盘 |
| 预训练 | Llama2-13B | meta-llama/Llama-2-13b-hf | HuggingFace | 迅雷网盘 |
| 预训练 | Llama2-70B | meta-llama/Llama-2-70b-hf | HuggingFace |
| Chat | Llama2-7B-Chat | meta-llama/Llama-2-7b-chat-hf | HuggingFace | 迅雷网盘 |
| Chat | Llama2-13B-Chat | meta-llama/Llama-2-13b-chat-hf | HuggingFace | 迅雷网盘 |
| Chat | Llama2-70B-Chat | meta-llama/Llama-2-70b-chat-hf | HuggingFace | 迅雷网盘 |
| Code | CodeLlama-7b | meta-llama/Llama-2-70b-chat-hf | 迅雷网盘 |
| Code | CodeLlama-7b-Python | meta-llama/Llama-2-70b-chat-hf | 迅雷网盘 |
| Code | CodeLlama-7b-Instruct | meta-llama/Llama-2-70b-chat-hf | 迅雷网盘 |
| Code | CodeLlama-13b | meta-llama/Llama-2-70b-chat-hf | 迅雷网盘 |
| Code | CodeLlama-13b-Python | meta-llama/Llama-2-70b-chat-hf | 迅雷网盘 |
| Code | CodeLlama-13b-Instruct | meta-llama/Llama-2-70b-chat-hf | 迅雷网盘 |
| Code | CodeLlama-34b | meta-llama/Llama-2-70b-chat-hf | 迅雷网盘 |

Meta官方在2023年8月24日发布了Code Llama,基于代码数据对Llama2进行了微调,提供三个不同功能的版本:基础模型(Code Llama)、Python专用模型(Code Llama - Python)和指令跟随模型(Code Llama - Instruct),包含7B、13B、34B三种不同参数规模。不同模型能力区别如下表所示:

|-----------------------|------------------------|------|------|------|
| 模型类别 | 模型名称 | 代码续写 | 代码填充 | 指令编程 |
| Code Llama | CodeLlama-7b | ✅ | ✅ | ❌ |
| | CodeLlama-13b | ✅ | ✅ | ❌ |
| | CodeLlama-34b | ✅ | ❌ | ❌ |
| Code Llama - Python | CodeLlama-7b-Python | ✅ | ❌ | ❌ |
| | CodeLlama-13b-Python | ✅ | ❌ | ❌ |
| | CodeLlama-34b-Python | ✅ | ❌ | ❌ |
| Code Llama - Instruct | CodeLlama-7b-Instruct | ❌ | ✅ | ✅ |
| | CodeLlama-13b-Instruct | ❌ | ✅ | ✅ |
| | CodeLlama-34b-Instruct | ❌ | ❌ | ✅ |

关于Code Llama的详细信息可以参考官方Github仓库codellama:++https://github.com/facebookresearch/codellama++

Llama2中文微调模型

基于中文指令数据集对Llama2-Chat模型进行了微调,使得Llama2模型有着更强的中文对话能力。LoRA参数以及与基础模型合并的参数均已上传至Hugging Face,目前包含7B和13B的模型。

|--------|------------------------------|----------------------------------------|--------------------------------|----------------------------------------------------------------------------------------------------------------|
| 类别 | 模型名称 | 🤗模型加载名称 | 基础模型版本 | 下载地址 |
| 合并参数 | Llama2-Chinese-7b-Chat | FlagAlpha/Llama2-Chinese-7b-Chat | meta-llama/Llama-2-7b-chat-hf | HuggingFace |
| 合并参数 | Llama2-Chinese-13b-Chat | FlagAlpha/Llama2-Chinese-13b-Chat | meta-llama/Llama-2-13b-chat-hf | HuggingFace |
| LoRA参数 | Llama2-Chinese-7b-Chat-LoRA | FlagAlpha/Llama2-Chinese-7b-Chat-LoRA | meta-llama/Llama-2-7b-chat-hf | HuggingFace |
| LoRA参数 | Llama2-Chinese-13b-Chat-LoRA | FlagAlpha/Llama2-Chinese-13b-Chat-LoRA | meta-llama/Llama-2-13b-chat-hf | LlzLl zLlLHuggingFace |

相关推荐
deephub1 小时前
深入BERT内核:用数学解密掩码语言模型的工作原理
人工智能·深度学习·语言模型·bert·transformer
Aurora-silas5 小时前
LLM微调尝试——MAC版
人工智能·pytorch·深度学习·macos·机器学习·语言模型·自然语言处理
wb043072017 小时前
如何开发一个 IDEA 插件通过 Ollama 调用大模型为方法生成仙侠风格的注释
人工智能·语言模型·kotlin·intellij-idea
辣大辣条9 小时前
LLAMA Factory 微调Qwen2.0-VL-2B视觉大模型
语言模型
星期天要睡觉13 小时前
大模型(Large Language Model, LLM)——什么是大模型,大模型的基本原理、架构、流程
人工智能·python·ai·语言模型
言之。13 小时前
大语言模型科普报告
人工智能·语言模型·自然语言处理
文火冰糖的硅基工坊13 小时前
[人工智能-大模型-27]:大模型应用层技术栈 - 大语言模型中的token是什么?
人工智能·语言模型·自然语言处理
wb043072011 天前
性能优化实战:基于方法执行监控与AI调用链分析
java·人工智能·spring boot·语言模型·性能优化
海森大数据1 天前
三步破局:一致性轨迹强化学习开启扩散语言模型“又快又好”推理新时代
人工智能·语言模型·自然语言处理
董厂长1 天前
阅读:REACT: SYNERGIZING REASONING AND ACTING INLANGUAGE MODELS(在语言模型中协同推理与行动)
人工智能·语言模型·agent·react