开源中文大语言模型汇总

基于英文模型增量预训练的中文模型

LLama系列:

llama作为开源社区的宠儿,有许多基于它的中文模型,下面列举比较流行的一些模型

如果要学习如何做模型训练,推荐学习Chinese llama项目。如果是要选择强大的中文llama,推荐选Atom。

Mistral系列:

Mistral是超越llama的最强开源模型,由于发布时间晚于llama,因此其中文版本较少。

如果大家需要选用强大的中文Mistral,推荐选JiuZhou。

从头训练的中文模型

  • Qwen系列
  • Chatglm系列
  • Baichuan系列
  • Yi系列

后面持续更新

相关推荐
Echo_NGC22371 分钟前
【卷积神经网络 CNN】一文讲透卷积神经网络CNN的核心概念与演进历程
人工智能·深度学习·神经网络·目标检测·机器学习·自然语言处理·cnn
achi0103 分钟前
Ubuntu 24 Desktop LTS 部署 AI 智能体 OpenClaw
人工智能·ai agent·openclaw·openclaw 安装·openclaw 部署·ubuntu openclaw·agent 部署
吴佳浩 Alben6 分钟前
CUDA_VISIBLE_DEVICES、多进程与容器化陷阱
人工智能·pytorch·语言模型·transformer
用户27042728381216 分钟前
排查 OpenClaw token 暴涨:MEMORY.md 藏了83行废话,3个Cron任务静默失败
人工智能
郑同学zxc17 分钟前
机器学习19-tensorflow4.2
人工智能·机器学习
zxsz_com_cn22 分钟前
设备预测性维护方案设计的关键要素
大数据·人工智能
格林威23 分钟前
工业相机参数解析:曝光时间与运动模糊的“生死博弈”
c++·人工智能·数码相机·opencv·算法·计算机视觉·工业相机
KG_LLM图谱增强大模型28 分钟前
EICopilot:基于LLM智能体和大规模知识图谱的企业信息智能搜索与探索系统
人工智能·知识图谱
GISer_Jing30 分钟前
阿里开源纯前端浏览器自动化 PageAgent,[特殊字符] 浏览器自动化变天啦?
前端·人工智能·自动化·aigc·交互
大模型任我行41 分钟前
腾讯:揭示评估幻觉并构建知识驱动新范式
人工智能·语言模型·自然语言处理·论文笔记