开源中文大语言模型汇总

基于英文模型增量预训练的中文模型

LLama系列:

llama作为开源社区的宠儿,有许多基于它的中文模型,下面列举比较流行的一些模型

如果要学习如何做模型训练,推荐学习Chinese llama项目。如果是要选择强大的中文llama,推荐选Atom。

Mistral系列:

Mistral是超越llama的最强开源模型,由于发布时间晚于llama,因此其中文版本较少。

如果大家需要选用强大的中文Mistral,推荐选JiuZhou。

从头训练的中文模型

  • Qwen系列
  • Chatglm系列
  • Baichuan系列
  • Yi系列

后面持续更新

相关推荐
转转技术团队11 分钟前
没有测试的核心代码,怎么交给 AI 重构
人工智能
爱读源码的大都督1 小时前
Claude Code源码分析(三):为什么系统提示词中需要有tools呢?
前端·人工智能·后端
半个落月2 小时前
LLM如何预测下一个Token?一文拆解Transformer核心流程
人工智能
触底反弹2 小时前
🔥 2026 年爆火的 Harness Engineering 到底是什么?从原理到实战一文讲透
javascript·人工智能·程序员
user4465117917912 小时前
源码深读 XAgent:6 个 Agent 怎么分工?工具失败不崩、死循环怎么防?
人工智能
魏祖潇2 小时前
SDD 完整指南——Spec 端打底、Story 端交付、留白区
人工智能·后端
常丛丛2 小时前
5.9 式输出:实时查看 LangGraph Agent 思考过程
人工智能
Token炼金师2 小时前
从节点图到低秩矩阵:ComfyUI 推理引擎与 LoRA 适配机制拆解
人工智能·aigc
武子康2 小时前
调查研究-210 Netflix 用 AI 复刻 Gene Wilder 的声音:语音克隆的下半场,不是模型,而是权利
人工智能·aigc·openai
Quz3 小时前
在 Obsidian 中嵌入 Claude Code 的实践记录
人工智能·claude