开源中文大语言模型汇总

基于英文模型增量预训练的中文模型

LLama系列:

llama作为开源社区的宠儿,有许多基于它的中文模型,下面列举比较流行的一些模型

如果要学习如何做模型训练,推荐学习Chinese llama项目。如果是要选择强大的中文llama,推荐选Atom。

Mistral系列:

Mistral是超越llama的最强开源模型,由于发布时间晚于llama,因此其中文版本较少。

如果大家需要选用强大的中文Mistral,推荐选JiuZhou。

从头训练的中文模型

  • Qwen系列
  • Chatglm系列
  • Baichuan系列
  • Yi系列

后面持续更新

相关推荐
code bean6 小时前
【AI 】OpenSpec 实战指南:在 Cursor 中落地 AI 原生开发工作流
人工智能·cursor·ai工作流·openspec
多恩Stone6 小时前
【3D AICG 系列-6】OmniPart 训练流程梳理
人工智能·pytorch·算法·3d·aigc
江瀚视野6 小时前
多家银行向甲骨文断贷,巨头甲骨文这是怎么了?
大数据·人工智能
ccLianLian6 小时前
计算机基础·cs336·损失函数,优化器,调度器,数据处理和模型加载保存
人工智能·深度学习·计算机视觉·transformer
asheuojj6 小时前
2026年GEO优化获客效果评估指南:如何精准衡量TOP5关
大数据·人工智能·python
多恩Stone7 小时前
【RoPE】Flux 中的 Image Tokenization
开发语言·人工智能·python
callJJ7 小时前
Spring AI ImageModel 完全指南:用 OpenAI DALL-E 生成图像
大数据·人工智能·spring·openai·springai·图像模型
铁蛋AI编程实战7 小时前
2026 大模型推理框架测评:vLLM 0.5/TGI 2.0/TensorRT-LLM 1.8/DeepSpeed-MII 0.9 性能与成本防线对比
人工智能·机器学习·vllm
23遇见7 小时前
CANN ops-nn 仓库高效开发指南:从入门到精通
人工智能
SAP工博科技7 小时前
SAP 公有云 ERP 多工厂多生产线数据统一管理技术实现解析
大数据·运维·人工智能