囊括所有大模型:高质量中文预训练模型&大模型&多模态模型&大语言模型集合

在自然语言处理领域中,预训练语言模型(Pretrained Language Models)已成为非常重要的基础技术,本仓库主要收集目前网上公开的一些高质量中文预训练模型、中文多模态模型、中文大语言模型等内容(感谢分享资源的大佬),并将持续更新...

Expand Table of Contents

Base-LLM

大规模基础模型:表格中只罗列出参数量大于7B以上模型。

模型 大小 时间 语言 领域 下载 项目地址 机构/个人 架构 文献 备注
Breeze-Base 7B 2024-02 中英 通用 🤗HF / MediaTek Research
TowerBase 7/13B 2024-02 多语 通用 [🤗HF] / Unbabel CD
Qwen1.5-Base 0.5/1.8/4 7/14/72B 2024-02 中英 通用 [🤗HF] Qwen1.5 Qwen / Blog
LongAlign-Base 6/7/13B 2024-02 中英 通用 [🤗HF] LongAlign THUDM / Paper
Chinese-Mixtral-Base 8x7B 2024-02 中英 通用 [Baidu] [🤗HF] Chinese-Mixtral Yiming Cui MOE
iFlytekSpark-Base 13B 2024-01 中英 通用 mindspore / 科大讯飞 CD
Orion-Base 14B 2024-01 多语 通用 [🤗HF] Orion OrionStarAI CD Paper RAG Plugin
YaYi2-Base 30B 2023-12 多语 通用 [🤗HF] YAYI2 wenge-research CD Paper
Aquila2-Base 7/34/70B 2023-12 中英 通用 [🤗HF] Aquila2 FlagAI CD
Alaya-Base 7B 2023-12 中英 通用 [🤗HF] Alaya DataCanvas CD
Qwen-Base 1.8/7 14/72B 2023-12 中英 通用 [🤗HF] Qwen 阿里云 CD Paper Report Report2
DeepSeek-Base 7/67B 2023-11 中英 通用 [🤗HF] DeepSeek-LLM deepseek-ai CD
Yuan-2.0 2/51 102B 2023-11 中英 通用 baidu [🤗HF] Yuan-2.0 IEIT-Yuan CD
Alaya-Base 7B 2023-11 中英 通用 [🤗HF] Alaya DataCanvasIO CD
Yi-Base 6/9/34B 2023-11 中英 通用 [🤗HF] Yi 01.AI CD
XVERSE-Base 7/13 65B 2023-11 多语 通用 [🤗HF] XVERSE 元象科技 CD
Nanbeige-Base 16B 2023-11 中英 通用 [🤗HF] Nanbeige Nanbeige LLM Lab CD
LingoWhale 8B 2023-11 中英 通用 [🤗HF] LingoWhale-8B DeepLang AI CD
Skywork-base 13B 2023-10 中文 通用 [🤗HF] Skywork SkyworkAI CD Paper
BlueLM-Base 7B 2023-11 中英 通用 [🤗HF] BlueLM vivo AI Lab CD
Chatglm3-base 6B 2023-10 中英 通用 [🤗HF] ChatGLM3 THUDM ND
Ziya2-Base 13B 2023-10 中英 通用 [🤗HF] Fengshenbang-LM IDEA研究院 CD
OpenBA-LM 15B 2023-09 中英 通用 [🤗HF] OpenBA OpenNLG Group ED Paper
TigerBot-Base-70B 80B 2023-09 多语 通用 [🤗HF] TigerBot 虎博科技 CD Paper
FLM 101B 2023-09 中英 通用 [🤗HF] / CofeAI CD
falcon 7/40 180B 2023-09 多语 通用 [🤗HF] / Technology Innovation Institute CD
Baichuan2 7/13B 2023-09 中文 通用 [🤗HF] Baichuan2 百川智能 CD
Chinese-LLaMA-2-16K 7/13B 2023-08 中英 通用 [🤗HF] Chinese-LLaMA-Alpaca-2 Yiming Cui CD
YuLan-LLaMA-2 13B 2023-08 中英 通用 [🤗HF] YuLan-Chat 中国人民大学 CD
Aquila-Base-33B 33B 2023-08 中英 通用 TODO Aquila FlagAI CD
TigerBot-Base-13B 13B 2023-08 多语 通用 [🤗HF] TigerBot 虎博科技 CD
Linly-Chinese-LLaMA-2 7/13B 2023-07 中英 通用 [🤗HF] Linly 深圳大学计算机视觉研究所 CD
Chinese-LLaMA-2 7B 2023-07 中英 通用 [🤗HF] Chinese-LLaMA-Alpaca-2 Yiming Cui CD
Jiang-base 13B 2023-07 中文 通用 [🤗HF] / 知未智能 CD
bwx 7/13B 2023-07 中文 通用 [🤗HF] / 蓝鲸国数 CD
Llama2 7/13 70B 2023-07 多语 通用 [🤗HF] llama Meta CD Paper
PolyLM 13B 2023-07 多语 通用 [🤗HF] PolyLM 达摩院 CD Paper
Baichuan-13B 13B 2023-07 中文 通用 [🤗HF] Baichuan-13B 百川智能 CD
TigerBot 7B 2023-07 多语 通用 [🤗HF] TigerBot 虎博科技 CD
InternLM-base 7/20B 2023-07 中文 通用 [🤗HF] InternLM 上海人工智能实验室 CD report
MPT 7/30B 2023-06 多语 通用 [🤗HF] llm-foundry MosaicML CD
Baichuan 7B 2023-06 中英 通用 [🤗HF] baichuan-7B 百川智能 CD
Chinese-Falcon 7B 2023-06 中英 通用 [🤗HF] Linly 深圳大学计算机视觉研究所 CD Blog
AtomGPT 13B 2023-06 中英 通用 [🤗HF] / 原子回声 CD
Aquila 7B 2023-06 中英 通用 [🤗HF] Aquila FlagAI CD
Chinese-LLaMA 33B 2023-06 中英 通用 [🤗HF] Chinese-LLaMA-Alpaca Yiming Cui CD
TigerBot 7B 2023-06 多语 通用 [🤗HF] TigerBot 虎博科技 CD
Panda-OpenLLaMA 7B 2023-05 中英 通用 [🤗HF] pandallm dandelionsllm CD
Panda 7/13B 2023-05 中英 通用 [🤗HF] pandallm dandelionsllm CD
OpenLLaMA 13B 2023-05 中英 通用 [🤗HF] Linly 深圳大学计算机视觉研究所 CD
BiLLa-LLM 7B 2023-05 中英 通用 [🤗HF] BiLLa Zhongli Li CD
Ziya-LLaMA-Reward 7B 2023-05 中英 通用 [🤗HF] Fengshenbang-LM IDEA研究院 CD
YuYan 11B 2023-04 中文 通用 [🤗HF] / 网易伏羲 CD Paper
Chinese-LLaMA 7/13/33B 2023-04 中文 通用 [🤗HF] Linly 深圳大学计算机视觉研究所 CD Blog
OpenChineseLLaMA 7B 2023-04 中英 通用 [🤗HF] OpenChineseLLaMA OpenLMLab CD
MOSS-003 16B 2023-04 中英 通用 [🤗HF] MOSS 复旦大学 CD
BBT-2-Text 13B 2023-04 中文 通用 申请 BBT-FinCUGE-Applications 超对称 CD Paper
BBT-2-Text 12B 2023-04 中文 通用 申请 BBT-FinCUGE-Applications 超对称 CD Paper
Chinese-LLaMA 13B 2023-04 中英 通用 [🤗HF] Chinese-LLaMA-Alpaca Yiming Cui CD
flan-ul2 20B 2023-03 多语 通用 [🤗HF] ul2 Google ED Paper
CPM-Bee 10B 2023-01 中英 通用 [🤗HF] CPM-Bee OpenBMB CD
BLOOM 176B 2022-11 多语 通用 [🤗HF] Megatron-DeepSpeed BigScience CD Paper
BLOOMZ 176B 2022-11 多语 通用 [🤗HF] Megatron-DeepSpeed BigScience CD Paper
flan-t5-xxl 11B 2022-11 多语 通用 [🤗HF] t5x Google ED paper
CPM-Ant+ 10B 2022-10 中英 通用 BMB CPM-Live OpenBMB CD blog
GLM 130B 2022-10 中英 通用 申请 GLM-130B 清华大学 ND paper
CPM-Ant 10B 2022-09 中文 通用 [🤗HF] CPM-Live OpenBMB CD blog
GLM 10B 2022-09 中文 通用 [🤗HF] GLM 清华大学 ND paper
源1.0 245B 2021-09 中文 通用 API Yian-1.0 浪潮 CD paper
CPM-2 10/11/ 200B 2021-06 中文 通用 申请 CPM 智源研究院 ED paper
PanGu-Alpha 13/200B 2021-05 中文 通用 [🤗HF] PanGu-Alpha 鹏城实验室 CD paper
PLUG 27B 2021-04 中文 通用 申请 AliceMind 阿里巴巴 ED
GPT-3 13/30B 2021-04 中文 通用 TODO GPT-3 达摩院 CD

[[Back to Top](#Back to Top)]

Domain-Base-LLM

各个垂直领域开源基础模型

模型 大小 时间 语言 领域 下载 项目地址 机构/个人 架构 文献 备注
Tongyi-Finance-Base 14B 2023-11 中文 金融 ModelScope 通义金融-14B 通义金融大模型 CD
ChiMed-GPT 13B 2023-10 中文 医疗 [🤗HF] ChiMed-GPT 中国科学技术大学 CD Paper
CodeShell-base 7B 2023-10 中英 代码 [🤗HF] codeshell WisdomShell CD
WiNGPT-base 7B 2023-09 中文 医学 [🤗HF] WiNGPT2 Winning Health AI Research CD
XuanYuan 70B 2023-09 中文 金融 [🤗HF] XuanYuan 度小满 CD Report
CodeLLAma 7/13/ 34B 2023-08 多语 代码 [🤗HF] codellama Meta Research CD Paper
educhat-base-002 7/13B 2023-06 中英 教育 [🤗HF] EduChat 华东师范大学 CD
AquilaCode-NV 7B 2023-06 中英 代码 [🤗HF] Aquila FlagAI CD
AquilaCode-TS 7B 2023-06 中英 代码 [🤗HF] Aquila FlagAI CD
LaWGPT 7B 2023-05 中英 法律 [🤗HF] LawGPT Pengxiao Song CD
CodeGeeX 13B 2022-06 多语 代码 申请 CodeGeeX 清华大学 CD blog

[[Back to Top](#Back to Top)]

ChatLLM

具备问答和对话等功能的大型语言模型。

模型 大小 时间 语言 领域 下载 项目地址 机构/个人 架构 文献
Command-R 35B 2024-03 多语 通用 🤗HF / CohereForAI CD
Breeze-Instruct 7B 2024-02 中英 通用 🤗HF / MediaTek Research
aya-101 13B 2024-02 多语 通用 🤗HF / Cohere For AI CD Paper
ChemLLM 7B 2024-02 多语 通用 🤗HF / AI4Chem CD Paper
TowerInstruct 7/13B 2024-02 多语 通用 [🤗HF] / Unbabel CD
Qwen1.5-Chat 0.5/1.8/4/ 7/1472B 2024-02 中英 通用 [🤗HF] Qwen1.5 Qwen / Blog
MiniCPM 2B 2024-02 中英 通用 [🤗HF] ModelScope MiniCPM OpenBMB / Report
LongAlign-Chat 6/7/13B 2024-02 中英 通用 [🤗HF] LongAlign THUDM / Paper
Chinese-Mixtral-Chat 8x7B 2024-02 中英 通用 [Baidu] [🤗HF] Chinese-Mixtral Yiming Cui MOE
iFlytekSpark-Chat 13B 2024-01 中英 通用 mindspore / 科大讯飞 CD
rwkv-5-world 0.1/1/ 3/7B 2023-01 多语 通用 [🤗HF] RWKV-LM BlinkDL URL
Orion-Chat 14B 2024-01 多语 通用 [🤗HF] Orion OrionStarAI CD Paper
internlm2-chat 7/20B 2024-01 中英 通用 [🤗HF] InternLM InternLM CD Report
Chinese-Mixtral 8x7B 2023-01 中英 通用 [🤗HF] / HIT-SCIR CD-MOE
Telechat 7/12B 2024-01 中英 通用 [🤗HF] Telechatx Tele-AI CD Report
kagentlms 7/13B 2024-01 中英 通用 [🤗HF] KwaiAgents KwaiKEG
YaYi2-Chat 30B 2023-12 多语 通用 [🤗HF] YAYI2 wenge-research CD Paper
SUS-Chat 34/72B 2023-12 中英 通用 [🤗HF] SUS-Chat SUSTech-IDEA CD
Aquila2-Chat 7/34/70B 2023-12 中英 通用 [🤗HF] Aquila2 FlagAI CD
Alaya-Chat 7B 2023-12 中英 通用 [🤗HF] Alaya DataCanvas CD
Qwen-Chat 1.8/7/ 14/72B 2023-12 中英 通用 [🤗HF] Qwen 阿里云 CD Paper Report Report2
DeepSeek-Chat 7/67B 2023-11 中英 通用 [🤗HF] DeepSeek-LLM deepseek-ai CD
Yi-Chat 6/34B 2023-11 中英 通用 [🤗HF] Yi 01.AI CD
Alaya-Chat 7B 2023-11 中英 通用 [🤗HF] Alaya DataCanvasIO CD
OrionStar-Yi-Chat 34B 2023-11 中英 通用 [🤗HF] OrionStar-Yi-34B-Chat OrionStarAI CD
Nanbeige-Chat 16B 2023-11 中英 通用 [🤗HF] Nanbeige Nanbeige LLM Lab CD
OpenChat 3.5 7B 2023-11 中英 通用 [🤗HF] openchat OpenChat CD Paper
XVERSE-Chat 7/13B 2023-11 多语 通用 [🤗HF] XVERSE 元象科技 CD
AndesGPT 7B 2023-11 中文 通用 [🤗HF] AndesGPT-7B OPPO-Mente-Lab CD
SeaLLM-Chat 13B 2023-11 多语 通用 [🤗HF] SeaLLMs SeaLLMs CD
BlueLM 7B 2023-11 中英 通用 [🤗HF] BlueLM vivo AI Lab CD
Skywork-chat 13B 2023-10 中文 通用 [🤗HF] Skywork SkyworkAI CD Paper
Zephyr 7B 2023-10 多语 通用 [🤗HF] alignment-handbook Hugging Face H4 CD Paper
Mistral 7B 2023-10 多语 通用 [🤗HF] mistral-src Mistral AI CD Paper
chatglm3 6B 2023-10 中英 通用 [🤗HF] ChatGLM3 THUDM ND
Zhiyin-chat 7B 2023-10 中英 通用 [🤗HF] Zhiyin 中科院声学所 CD
Ziya2-Chat 13B 2023-10 中英 通用 [🤗HF] Fengshenbang-LM IDEA研究院 CD
Vulture 40/180B 2023-10 多语 通用 [🤗HF] / VILM-AI TODO
Vulture 3/7/ 40/180B 2023-09 多语 通用 [🤗HF] / VILM CD
Colossal-LLaMA-2 7B 2023-09 中英 通用 [🤗HF] ColossalAI HPC-AI Tech CD Blog
OpenBA-chat 15B 2023-09 中英 通用 TODO OpenBA OpenNLG Group ED Paper
WeMix-LLaMA2 7/70B 2023-09 中英 通用 [🤗HF] WeMix-LLM Alpha-VLLM CD
Stable Beluga 7/13/70B 2023-09 中英 通用 [🤗HF] / Stability AI CD
TigerBot-chat 70B 2023-09 中英 通用 [🤗HF] TigerBot 虎博科技 CD Paper
Openbuddy_llama 70B 2023-09 多语 通用 [🤗HF] OpenBuddy OpenBuddy CD
falcon-180B-chat 180B 2023-09 多语 通用 [🤗HF] / Technology Innovation Institute CD
Baichuan2 7/13B 2023-09 中文 通用 [🤗HF] Baichuan2 百川智能 CD
Chinese-Alpaca-2-16K 7/13B 2023-09 中英 通用 [🤗HF] Chinese-LLaMA-Alpaca-2 Yiming Cui CD
InternLM-Chat-8k 7B 2023-08 中文 通用 [🤗HF] InternLM 上海人工智能实验室 CD report
InternLM-Chat-v1.1 7B 2023-08 中文 通用 [🤗HF] InternLM 上海人工智能实验室 CD report
YuLan-Chat-2 13B 2023-08 中英 通用 [🤗HF] YuLan-Chat 中国人民大学 CD
falcon 7/40B 2023-06 多语 通用 [🤗HF] [🤗HF] Technology Innovation Institute CD
Toucan 7B 2023-08 中英 通用 [🤗HF] Toucan-LLM Kendryte CD
Zhuzhi 6B 2023-08 中英 通用 [🤗HF] Zhuzhi-6B 竹间智能 ND
Atom 7B 2023-08 中英 通用 [🤗HF] Llama2-Chinese FlagAlpha CD
openbuddy 3/7/ 13/40B 2023-08 多语 通用 [🤗HF] OpenBuddy OpenBuddy CD
Aquila-Chat-33B 33B 2023-08 中英 通用 TODO Aquila FlagAI CD
vicuna-V1.5-16K 7/13B 2023-08 多语 通用 [🤗HF] FastChat lm-sys CD Paper
vicuna-V1.5 7/13B 2023-08 多语 通用 [🤗HF] FastChat lm-sys CD Paper
Chinese-Alpaca-2 13B 2023-08 中英 通用 [🤗HF] Chinese-LLaMA-Alpaca-2 Yiming Cui CD
WizardLM-V1.0 70B 2023-08 多语 通用 [🤗HF] WizardLM operatorx CD
TigerBot-chat-13B 13B 2023-07 中英 通用 [🤗HF] TigerBot 虎博科技 CD
huozi 7B 2023-08 中英 通用 [🤗HF] huozi 哈工大 CD
Chinese-Alpaca-2 7B 2023-07 中英 通用 [🤗HF] Chinese-LLaMA-Alpaca-2 Yiming Cui CD
AntX 7/13B 2023-07 中文 通用 [🤗HF] / AntX.ai CD
BatGPT 15B 2023-07 中英 通用 [🤗HF] BatGPT 上海交通大学 ND Paper
WizardLM-V1.2 13B 2023-07 多语 通用 [🤗HF] WizardLM operatorx CD Paper
llama2-Chinese-chat 13B 2023-07 中英 通用 [🤗HF] llama2-Chinese-chat Ke Bai CD
Jiang-chat 13B 2023-07 中文 通用 [🤗HF] / 知未智能 CD
Llama2-chinese-chat 7/13B 2023-07 中英 通用 [🤗HF] Llama2-Chinese FlagAlpha CD
LL7M 7B 2023-07 多语 通用 [🤗HF] / Joseph Cheung CD
Chinese-Llama-2 7B 2023-07 中英 通用 [🤗HF] Chinese-Llama-2-7b LinkSoul-AI CD
Llama2-chat 7/13/70B 2023-07 多语 通用 [🤗HF] llama Meta CD Paper
PolyLM-chat 13B 2023-07 多语 通用 [🤗HF] PolyLM 达摩院 CD Paper
Baichuan-13B-chat 13B 2023-07 中文 通用 [🤗HF] Baichuan-13B 百川智能 CD
vicuna-V1.3 7/13/33B 2023-07 多语 通用 [🤗HF] FastChat lm-sys CD Paper
WizardLM-V1.0 7/13/30B 2023-07 多语 通用 [🤗HF] WizardLM operatorx CD Paper
TigerBot-v2-sft 7B 2023-07 多语 通用 [🤗HF] TigerBot 虎博科技 CD
InternLM-chat 7/20B 2023-07 中文 通用 [🤗HF] InternLM 上海人工智能实验室 CD report
vicuna汉化版 33B 2023-07 中文 通用 baidu-hiks chinese-StableVicuna ziwang-com CD
CuteGPT 13B 2023-07 中英 通用 [🤗HF] CuteGPT 复旦大学知识工场 CD
MPT-chat 7/30B 2023-06 多语 通用 [🤗HF] llm-foundry MosaicML CD
ChatGLM2 6B 2023-06 中英 通用 [🤗HF] ChatGLM2-6B 清华大学 ND
BayLing 7/13B 2023-06 中英 通用 [🤗HF] BayLing 中国科学院 CD
ZhiXi-Diff 13B 2023-06 中英 通用 [🤗HF] KnowLLM 浙江大学 CD
Anima 33B 2023-06 中文 通用 [🤗HF] Anima Gavin Li CD
OpenLLaMA-Chinese 3/7/13B 2023-06 中文 通用 [🤗HF] OpenLLaMA-Chinese FittenTech CD
openbuddy-falcon-7b-v1.5 7B 2023-06 多语 通用 [🤗HF] OpenBuddy OpenBuddy CD
AtomGPT_chat 13B 2023-06 中英 通用 [🤗HF] AtomGPT 原子回声 CD
AquilaChat 7B 2023-06 中英 通用 [🤗HF] Aquila FlagAI CD
YuLan-Chat 13/65B 2023-06 中英 通用 [🤗HF] YuLan-Chat 中国人民大学 CD
Chinese-Alpaca 33B 2023-06 中文 通用 [🤗HF] Chinese-LLaMA-Alpaca Yiming Cui CD
TigerBot-sft 7/180B 2023-06 多语 通用 [🤗HF] TigerBot 虎博科技 CD
ChatYuan 7B 2023-06 中英 通用 [🤗HF] ChatYuan-7B ClueAI CD
Panda-Instruct 13B 2023-05 中英 通用 [🤗HF] pandallm dandelionsllm CD
Panda-Instruct 7B 2023-05 中英 通用 [🤗HF] pandallm dandelionsllm CD
BiLLa-SFT 7B 2023-05 中英 通用 [🤗HF] BiLLa Zhongli Li CD
Ziya-LLaMA-v1 13B 2023-05 中英 通用 [🤗HF] Fengshenbang-LM IDEA研究院 CD Blog
BLOOMChat V1.0 176B 2023-05 多语 通用 [🤗HF] bloomchat SambaNova Systems CD Blog
BiLLa 7B 2023-05 中英 通用 [🤗HF] BiLLa Zhongli Li CD
Bactrian-X 7/13B 2023-05 多语 通用 [🤗HF] bactrian-x MBZUAI CD
Bactrian-ZH 7B 2023-05 中文 通用 [🤗HF] bactrian-x MBZUAI CD
ChatFlow 7/13B 2023-05 中英 通用 [🤗HF] Linly 深圳大学计算机视觉研究所 CD
OpenBuddy 7/13B 2023-05 多语 通用 [🤗HF] OpenBuddy OpenBuddy CD
YuYan-dialogue 11B 2023-04 中文 通用 [🤗HF] / 网易伏羲 CD paper
Moss-moon-003-sft-plugin 16B 2023-04 中英 通用 [🤗HF] MOSS 复旦大学 CD
moss-moon-003-sft 16B 2023-04 中英 通用 [🤗HF] MOSS 复旦大学 CD
RWKV-4-Raven 3/7/14B 2023-04 中英 通用 [🤗HF] ChatRWKV BlinkDL RNN Blog
Phoenix-inst-chat 7B 2023-04 中文 通用 [🤗HF] LLMZoo 香港中文大学 CD
Phoenix-chat 7B 2023-04 中文 通用 [🤗HF] LLMZoo 香港中文大学 CD
ChatPLUG 3.7B 2023-04 中文 通用 [🤗HF] ChatPLUG 阿里巴巴 ED Paper
Chinese-Alpaca 13B 2023-04 中文 通用 [🤗HF] Chinese-LLaMA-Alpaca Yiming Cui CD
BELLE-LLAMA 13B 2023-04 中文 通用 [🤗HF] BELLE 贝壳 CD
LLaMA-tuned 7/13/ 33/65B 2023-04 中文 通用 [🤗HF] LMFlow 香港科技大学 CD
Chinese-Vicuna 7/13B 2023-03 中文 通用 [🤗HF] Chinese-Vicuna Facico CD
ChatYuan-V2 0.7B 2023-03 中英 通用 [🤗HF] ChatYuan 元语智能 ED
Chinese-Alpaca 7B 2023-03 中文 通用 [🤗HF] Chinese-LLaMA-Alpaca Yiming Cui CD
Luotuo 7B 2023-03 中文 通用 [🤗HF] Chinese-alpaca-lora 华中师范大学 CD
BELLE-LLAMA 7B 2023-03 中英 通用 [🤗HF] BELLE 贝壳 CD
ChatGLM 6B 2023-03 中英 通用 [🤗HF] ChatGLM-6B 清华大学 ND

[[Back to Top](#Back to Top)]

Domain-ChatLLM

开源的垂直领域对话大模型

模型 大小 时间 语言 领域 下载 项目地址 机构/个人 架构 文献
ChemDFM 13B 2024-03 中英 化学 🤗HF / OpenDFM CD Paper
starcoder2 3/7/15B 2024-02 中英 代码 🤗HF starcoder2 bigcode-project CD Paper
TuringMM-Chat 34B 2024-02 中英 教育 🤗HuggingFace 🤖ModelScope / 光年无限 CD
deepseek-moe 16B 2024-01 中英 代码 [🤗HF] DeepSeekMoE DeepSeek CD-MOE
Code Millenials 1/3/ 13/34B 2023-01 多语 代码 [🤗HF] code-millenials BudEcosystem CD
WizardCoder 15/33B 2024-01 多语 代码 [🤗HF] WizardLM operatorx CD Paper
DeepSeek-Coder 1/7/33B 2023-11 中英 代码 [🤗HF] DeepSeek-Coder deepseek-ai Blog
Phind 34B 2023-10 多语 代码 [🤗HF] / <Phind> CD Blog zh
Tongyi-Finance-Chat 14B 2023-11 中文 金融 ModelScope 通义金融-14B-Chat 通义金融大模型 CD
Skywork-math 13B 2023-10 中文 数学 [🤗HF] Skywork SkyworkAI CD Paper
XuanYuan-Chat 70B 2023-10 中英 金融 [🤗HF] XuanYuan Duxiaoman度小满 CD
zhilu 13B 2023-10 中英 金融 [🤗HF] / SYSU-MUCFC-FinTech-Research-Center CD
TestGPT 7B 2023-10 中文 测试 [🤗HF] Test-Agent codefuse-ai CD
cross 7/13B 2023-10 多语 数学 [🤗HF] / Mathoctopus CD
CodeFuse 13/14/ 15/34B 2023-10 中文 代码 [🤗HF] MFTCoder codefuse-ai CD
Taiyi 7B 2023-10 中英 医学 [🤗HF] Taiyi-LLM DUTIR-BioNLP CD
CodeShell-chat 7B 2023-10 中英 代码 [🤗HF] codeshell WisdomShell CD
DISC-LawLLM 13B 2023-09 中文 法律 [🤗HF] / ShengbinYue CD Report
WiNGPT-chat 7B 2023-09 中文 医学 [🤗HF] WiNGPT2 Winning Health AI Research CD
ziya-coding 15/34B 2023-09 中英 代码 [🤗HF] Fengshenbang-LM IDEA研究院 CD
AgriGPT 6/13b 2023-09 中文 农业 [🤗HF] AgriGPTs AgriGPTs
XuanYuan-chat 70B 2023-09 中文 金融 TODO XuanYuan 度小满 CD Report
夫子•明察 6B 2023-09 中文 司法 [🤗HF] fuzi.mingcha 山东大学 ND
仲景 13B 2023-09 中文 医学 [🤗HF] Zhongjing Songhua Yang CD Paper
CodeFuse 13/34B 2023-09 中英 代码 [🤗HF] MFTCoder codefuse-ai CD
EcomGPT 7B 2023-09 中英 电商 TODO EcomGPT Alibaba
DISC-MedLLM 13B 2023-08 中文 医疗 [🤗HF] DISC-MedLLM FudanDISC CD Paper
K2 7B 2023-08 中英 科学 [🤗HF] k2 daven CD
CodeLLAma 7/13/34B 2023-08 多语 代码 [🤗HF] codellama Meta Research CD Paper
sqlcoder 15B 2023-08 中英 代码 [🤗HF] sqlcoder Defog.ai CD
智海-录问 7B 2023-08 中文 法律 [🤗HF] wisdomInterrogatory zhihaiLLM CD
WizardMath-V1.0 7/13/70B 2023-08 多语 数学 [🤗HF] WizardLM operatorx CD
QiaoBan 7B 2023-08 中文 情感 [🤗HF] QiaoBen 哈尔滨工业大学
HuangDi 13B 2023-08 中文 中医 [🤗HF] HuangDI Zlasejd CD
ZhongJing 2023-08 中文 中医 TODO CMLM-ZhongJing 复旦大学
TCMLLM 6B 2023-08 中文 中医 [🤗HF] TCMLLM 2020MEAI ND
AutoAudit 7B 2023-07 中文 安全 [🤗HF] AutoAudit Jiaying Li CD
Lychee 10B 2023-07 中文 法律 [🤗HF] lychee_law davidpig ND
IvyGPT 6B 2023-07 中文 医学 [🤗HF] IvyGPT WangRongsheng
MING 7B 2023-07 中文 医学 [🤗HF] MING 上海交通大学 CD
Mozi 7B 2023-07 中英 科技 [🤗HF] science-llm GMFTBY CD
StarGLM 6B 2023-07 中文 天文 [🤗HF] StarGLM LI YUYANG ND
TransGPT 7B 2023-07 中英 交通 [🤗HF] TransGPT 北京交通大学 CD
CodeGeeX2 6B 2023-07 中英 代码 [🤗HF] CodeGeeX2 清华大学 ND
Yayi-llama2 7/13B 2023-07 中英 舆情 [🤗HF] Yayi 中科闻歌 CD
Ziya-Writing 13B 2023-07 中英 写作 [🤗HF] Fengshenbang-LM IDEA研究院 CD
MindChat 13B 2023-07 中文 心理 [🤗HF] MindChat 华东理工大学 CD
ShenNong-TCM-LLM 7B 2023-07 中英 医学 [🤗HF] ShenNong-TCM-LLM michael-wzhu CD
ailawyer 13B 2023-07 中英 法律 [🤗HF] JurisLMs openkg CD
educhat 7B/13B 2023-06 中英 教育 [🤗HF] EduChat 华东师范大学 CD
Sunsimiao 7B 2023-06 中英 医学 [🤗HF] Sunsimiao 华东理工大学 CD
Media LLaMA 7B 2023-06 中文 媒体 baidu Media-LLaMA 智媒开源研究院 CD
PULSE 7/14B 2023-06 中文 医学 [🤗HF] PULSE OpenMEDLab CD
ChatLaw 13/33B 2023-06 中文 法律 [🤗HF] ChatLaw 北京大学 CD
BaoLuo 6B 2023-06 中文 法律 [🤗HF] BaoLuo-LawAssisant LeiZi ND
CoLLaMA 7B 2023-06 中英 代码 [🤗HF] CoLLaMA Denilah CD
TechGPT 7B 2023-06 中英 教育 [🤗HF] TechGPT 东北大学 CD
Yayi 7B 2023-06 中英 舆情 [🤗HF] Yayi 中科闻歌 CD
MeChat 6B 2023-06 中文 医学 [🤗HF] smile qiuhuachuan ND
ziya-medical 13b 2023-06 中英 医学 [🤗HF] MedicalGPT Ming Xu CD
Taoli 7B 2023-06 中英 教育 待开源 taoli 北京语言大学 CD
Lawyer-llama 13B 2023-06 中英 法律 [🤗HF] lawyer-llama Quzhe Huang CD
QiZhen-CaMA 13B 2023-06 中英 医学 [🤗HF] QiZhenGPT 浙江大学 CD
扁鹊-2.0 6B 2023-06 中文 医学 [🤗HF] BianQue 华南理工大学 ND
SoulChat 6B 2023-06 中文 心理 [🤗HF] SoulChat 华南理工大学 ND
HanFei 7B 2023-05 中文 法律 baidu-d6t5 HanFei 中国科学院深圳先进院 CD
QiZhen 6B 2023-05 中英 医学 [baidu] QiZhenGPT 浙江大学 CD
ChatMed-Consult 7B 2023-05 中英 医学 [🤗HF] ChatMed michael-wzhu CD
LaWGPT-beta1.1 7B 2023-05 中英 法律 [🤗HF] LawGPT Pengxiao Song CD
Cornucopia 7B 2023-05 中英 金融 [🤗HF] Cornucopia-LLaMA-Fin-Chinese yuyangmu CD
HuatuoGPT 7B 2023-05 中文 医学 [🤗HF] HuatuoGPT 香港中文大学 CD Paper
LexiLaw 6B 2023-05 中文 法律 [🤗HF] LexiLaw Haitao Li ND Paper
XuanYuan 176B 2023-05 中文 金融 申请 XuanYuan 度小满 CD Paper
LawGPT 6B 2023-05 中文 法律 [🤗HF] LAW-GPT hongchengliu N
扁鹊-1.0 0.7B 2023-04 中文 医学 [🤗HF] BianQue scutcyr ED
ChatGLM-Med 6B 2023-04 中文 医学 [🤗HF] Med-ChatGLM 哈尔滨工业大学 ED
BenTsao 7B 2023-04 中文 医学 [🤗HF] Huatuo-Llama-Med-Chinese 哈尔滨工业大学 CD
DoctorGLM 6B 2023-04 中文 医学 TODO DoctorGLM xionghonglin ND
Firefly 1/2/7B 2023-04 中文 文化 [🤗HF] Firefly Yang JianXin CD
ChatRWKV 7B 2023-01 中英 小说 [🤗HF] ChatRWKV BlinkDL RNN Blog

[[Back to Top](#Back to Top)]

MultiModal-ChatLLM

收集包含中文的多模态大模型,具备对话等功能。

模型 大小 时间 语言模型 非语言模型 语言 领域 下载 项目地址 机构/个人 文献
DeepSeek-VL 1.3/7B 2024-03 DeepSeek SigLip/SAM 中英 图文 🤗HF DeepSeek-VL deepseek-ai Paper
OmniLMM 3/12B 2024-02 MiniCPM SigLip 中英 图文 🤗HF OmniLMM [OpenBMB](https://github.com/01-ai)
MiniCPM-V 3B 2024-02 MiniCPM-2.4B SigLip-400M 中英 图文 🤗HF OmniLMM [OpenBMB](https://github.com/01-ai)
Yi-VL 6/34B 2024-01 Yi CLIP-VIT 中英 图文 [🤗HF] Yi 01-ai
Lyrics 14B 2023-12 / / 中英 图文 [🤗HF] Fengshenbang-LM IDEA研究院
Qwen-Audio 7B 2023-12 Qwen-7B Whisper-large-v2 中英 文音 [🤗HF] Qwen-Audio Qwen Paper
SPHINX 13B 2023-10 / / 中英 图文 [🤗HF] LLaMA2-Accessory Alpha-VLLM
Skywork-MM 13B 2023-10 / / 中英 图文 [🤗HF] Skywork SkyworkAI Paper
CogVLM 7/14B 2023-10 Qwen ViT 中英 图文 [🤗HF] / CausalLM
fuyu 8B 2023-10 / / 中英 图文 [🤗HF] / Adept AI Labs Blog
Ziya-Visual 14B 2023-10 LLaMA InstructBLIP 中英 图文 [🤗HF] Fengshenbang-LM IDEA研究院 Paper
CogVLM 17B 2023-10 EVA2-CLIP-E Vicuna-v1.5 中英 图文 TODO CogVLM THUDM Paper
idefics 9/80B 2023-10 LLaMA CLIP-ViT 中英 图文 [🤗HF] / HuggingFaceM4 log
InternLM-XComposer 7B 2023-10 InternLM EVA-CLIP 中英 图文 [🤗HF] InternLM-XComposer InternLM Report
WeMix-LLM 13B 2023-09 LLama2 / 中英 图文 [🤗HF] WeMix-LLM Alpha-VLLM
Vally 7/13B 2023-08 BelleGroup/BELLE-LLaMA-EXT OFA-Sys/chinese-clip-vit-large-patch14 中英 图文 [🤗HF] [🤗HF] Valley 罗瑞璞 Paper
SALMONN / 2023-08 / / 中英 语音 TODO SALMONN Bytedance
IDEFICS 9/80B 2023-08 llama CLIP-ViT 中英 图文-通用 [🤗HF] m4-logs HuggingFaceM4 Paper
Qwen-VL 7B 2023-08 Qwen-7B Openclip ViT-bigG 中英 通用 [🤗HF] Qwen-VL 阿里云
Qwen-VL-chat 7B 2023-08 Qwen-7B Openclip ViT-bigG 中英 通用 [🤗HF] Qwen-VL 阿里云
LLasM 7B 2023-07 Chinese-Llama2 whisper-large-v2 中英 语音 [🤗HF] LLaSM 北京灵琐
Chinese-LLaVA 7B 2023-07 Chinese-Llama2 Clip-vit 中英 视觉 [🤗HF] Chinese-LLaVA! 北京灵琐
RemoteGLM 6B 2023-07 VisualGLM-6B VisualGLM-6B 中文 遥感 TODO RemoteGLM lzw-lzw
VisualCLA 7B 2023-07 Chinese-Alpaca-Plus CLIP-ViT-L/14 中文 视觉 [🤗HF] Visual-Chinese-LLaMA-Alpaca! Ziqing Yang
yuren 7B 2023-07 baichuan-7B CLIP 中英 视觉 [🤗HF] yuren-baichuan-7b Pleisto
VisCPM-Chat 10B 2023-06 CPM-Bee Q-Former 中英 视觉 [🤗HF] VisCPM OpenBMB
VisCPM-Paint 10B 2023-06 CPM-Bee Stable Diffusion 2.1 中英 视觉 [🤗HF] VisCPM OpenBMB
XrayPULSE 7B 2023-06 PULSE MedCLIP 中文 医学 [🤗HF] XrayPULSE OpenMEDLab
SEEChat 6B 2023-06 ChatGLM CLIP-ViT 中文 / [🤗HF] SEEChat 360
Ziya-BLIP2-14B-Visual-v1 14B 2023-06 LLaMA-13B BLIP2 中英 通用 [🤗HF] Fengshenbang-LM! IDEA研究院
Video-LLaMA-BiLLA 7B 2023-05 BiLLa-7B MiniGPT-4 中英 通用 [🤗HF] Video-LLaMA 达摩院多语言NLP Paper
Video-LLaMA-Ziya 13B 2023-05 Ziya-13B MiniGPT-4 中英 通用 [🤗HF] Video-LLaMA 达摩院多语言NLP Paper
XrayGLM 6B 2023-05 ChatGLM-6B BLIP2-Qformer 中英 医学 [🤗HF] XrayGLM 澳门理工大学
X-LLM 2023-05 ChatGLM ViT-g 中文 / TODO X-LLM Paper
VisualGLM 6B 2023-05 ChatGLM-6B BLIP2-Qformer 中英 视觉 [🤗HF] VisualGLM-6B![

[[Back to Top](#Back to Top)]

中文指令数据集

收集包含中文的指令数据集,用于微调语言模型。

名称 大小 时间 语言 下载 项目地址 作者 备注
FinCorpus 50G 2023-09 中文 dataset XuanYuan 度小满 金融领域
TransGPT-sft 346k 2023-07 中文 dataset TransGPT 北京交通大学
TransGPT-pt 58k 2023-07 中文 dataset TransGPT 北京交通大学
ShareGPT-Chinese-English 90K 2023-07 中英 dataset llama2-Chinese-chat![ Ke Bai
educhat-sft-002-data-osm 400w 2023-06 中英 dataset EduChat 华东师范大学 教育
chatgpt-corpus 3M 2023-06 中文 dataset chatgpt-corpus plex
Simle 350k 2023-06 中文 dataset smile qiuhuachuan 心理健康
QiZhen 20k 2023-06 中文 dataset QiZhenGPT 浙江大学 医学
BayLing-80 80 2023-06 中英 dataset BayLing 中国科学院 多轮指令
Tigerbot-dataset 120k 2023-06 中英 dataset TigerBot 虎博科技
lawyer-llama / 2023-05 中文 dataset lawyer-llama Quzhe Huang 法律
Bactrian-X 67K 2023-05 多语 dataset bactrian-x MBZUAI
CrimeKgAssitant 52k 2023-05 中文 dataset LAW-GPT hongchengliu 法律
moss-002-sft-data 1.1M 2023-04 中英 dataset MOSS 复旦大学
moss-003-sft-data 1.1M 2023-04 中英 dataset MOSS 复旦大学
moss-003-sft-plugin-data 300K 2023-04 中英 dataset MOSS 复旦大学
Safety-Prompts 100K 2023-04 中文 dataset Safety-Prompts 清华大学 评测平台
OASST1 / 2023-04 多语 dataset Open-Assistant OpenAssistant
ShareChat 90K 2023-04 中英 dataset ShareChat czhko
GPT-4-LLM 52K 2023-04 中文 dataset GPT-4-LLM Instruction-Tuning-with-GPT-4 paper
COIG 200K 2023-04 中文 dataset FlagInstruct BAAI paper
RedGPT 50k 2023-04 中文 dataset RedGPT MiniGPT
shareGPT_cn 20k 2023-04 中文 dataset shareGPT_cn shareAI
generated_chat_0.4M 0.4M 2023-04 中文 dataset BELLE Ke Technologies 角色对话
multiturn_chat_0.8M 0.8M 2023-04 中文 dataset BELLE Ke Technologies 多轮任务
school_math_0.25M 0.25M 2023-04 中文 dataset BELLE Ke Technologies 数学题
Zhihu-KOL / 2023-03 中文 dataset Zhihu-KOL Rui Wang
InstructionWild 104k 2023-03 中英 dataset InstructionWild Xue Fuzhao
Alpaca-CoT /. 2023-03 中英 dataset Alpaca-CoT Qingyi Si
GuanacoDataset / 2023-03 多语 dataset guanaco-model Guanaco
Traditional-Chinese-alpaca 52K 2023-03 中文 dataset Traditional-Chinese Alpaca NTU NLP Lab gpt翻译
alpaca_chinese_dataset / 2023-03 中文 dataset alpaca_chinese_dataset akou 人工校验
alpaca-chinese-dataset / 2023-03 中文 dataset alpaca-chinese-dataset carbonz 机器翻译
train_2M_CN 2M 2023-03 中文 dataset BELLE Ke Technologies
train_1M_CN 1M 2023-03 中文 dataset BELLE Ke Technologies
train_0.5M_CN 0.5M 2023-03 中文 dataset BELLE Ke Technologies
HC3 人类-ChatGPT 问答 / 2023-03 中文 dataset chatgpt-comparison-detection SimpleAI
firefly-train-1.1M 1.1M 2023-03 中文 dataset Firefly Jianxin Yang

[[Back to Top](#Back to Top)]

Embedding

MTEB排行榜: https://huggingface.co/spaces/mteb/leaderboard 镜像

模型 大小 时间 语言 领域 下载 项目地址 机构/个人
BCE 279M 2024-01 多语 通用 [🤗HF] BCEmbedding netease-youdao
Cohere Base 2023-09 多语 通用 [🤗HF] / Cohere Blog
jina Base 2023-10 中英 通用 [🤗HF] / Jina AI
Dmeta 400MB 2024-02 中文 通用 [🤗HF] / DMetaSoul
bge-m3 2024-02 中文 通用 [🤗HF] / BAAI Paper
tao-8k 2023-11 中文 通用 [🤗HF] amu
bge s/b/l 2023-10 中文 通用 [🤗HF] / BAAI
gte-zh s/b/l 2023-08 中文 通用 [🤗HF] / Alibaba DAMO Paper
m3e s/b/l 2023-06 中文 通用 [🤗HF] / Moka-AI
LaBSE 多语 通用 [🤗HF] / Sentence Transformers

[[Back to Top](#Back to Top)]

大模型评估基准

1. C-Eval ![

C-Eval 是一个全面的中文基础模型评估套件。它包含了13948个多项选择题,涵盖了52个不同的学科和四个难度级别,查看论文了解更多细节。

[官方网站] [Github] [论文]

2. FlagEval ![

FlagEval是一个面向AI基础模型的评测工具包。我们的目标是探索和集合科学、公正、开放的基础模型评测基准、方法及工具,对多领域(如语言、语音、视觉及多模态)的基础模型进行多维度(如准确性、效率、鲁棒性等)的评测。我们希望通过对基础模型的评测,加深对基础模型的理解,促进相关的技术创新及产业应用。

[官方网站] [Github]

3. SuperCLUElyb ![外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

SuperCLUE琅琊榜,这是一个中文通用大模型对战评价基准,它以众包的方式提供匿名、随机的对战。在本文中,我们发布了初步的结果和基于Elo评级系统的排行榜,Elo评级是国际象棋和其他竞技游戏中广泛使用的评级系统。我们邀请整个社区加入这项工作,贡献新的模型,并通过提问和投票选出你最喜欢的答案来评估它们。

[官方网站] [Github]

4. XiezhiBenchmark ![

该基准包括来自13个不同学科的516个学科的220,000个多项选择题,以及15,000个来自单一学科和多个学科的问题。我们对47个最新的大型语言模型在Xiezhi上进行了评估,结果表明在科学、工程、农学、医学和艺术等领域,大型语言模型的表现超过了人类的平均水平,但在经济学、法学、教育学、文学、历史和管理学等领域,人类的表现仍然远远超过了大型语言模型。

[官方网站] [Github] [论文]

5. Open LLM Leaderboard

由HuggingFace组织的一个LLM评测榜单,目前已评估了较多主流的开源LLM模型,以英文为主。主要目标是跟踪、排名和评估最新的大语言模型和聊天机器人,让所有人方便的观察到开源社区的进展和评估这些模型。这个排行榜有一个关键优势,社区中的任何成员都可以提交模型,并在 Hugging Face 的 GPU 集群上自动评估。

[官方网站]

6. 中文大模型安全评测平台 ![外

大模型安全测评依托于一套系统的安全评测框架,涵盖了仇恨言论、偏见歧视言论、犯罪违法、隐私、伦理道德等八大类别,包括细粒度划分的40余个二级安全类别。

[官方网站] [Github] [论文]

7. OpenCompass大语言模型评测 !

OpenCompass 是一款开源、高效、全面的评测大模型体系及开放平台。我们提供完整开源可复现的评测框架,支持大语言模型、多模态模型各类模型的一站式评测。利用分布式技术,即使面对千亿参数模型也能在数小时内完成评测。基于多个不同维度的高认可度数据集开放多样化的评测方式,包括零样本评测、小样本评测和思维链评测,全方位量化模型各个维度能力。

[官方网站] [Github]

[[Back to Top](#Back to Top)]

在线体验大模型

:需要申请或者注册方可体验,更多见Github

1. ChatGPT--OpenAI

OpenAI所提出的GPT相关模型,也是目前最火的大语言模型,发布版本已经到了4.0.

[官方网站]

2. New bing--微软

NewBing是微软在2023年3月推出的一款全新的搜索引擎,它基于OpenAI的大型语言模型(LLM),并结合了ChatGPT和DALL·E的技术,为用户提供了一个AI驱动的网络助手。

[官方网站]

3. 文心一言--百度

百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。

[官方网站]

4. 通义大模型--阿里

阿里大模型统一品牌,覆盖语言、听觉、多模态等领域致力于实现接近人类智慧的通用智能,让AI从"单一感官"到"五官全开"

[官方网站]

5. 星火认知大模型--科大讯飞

科大讯飞推出的新一代认知智能大模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。

[官方网站]

6. Claude--Anthropic

Claude,是人工智能初创公司Anthropic 发布的一款类似ChatGPT的产品。

[官方网站]

7. ChatGLM--智谱AI

基于千亿基座模型 GLM-130B,注入代码预训练,通过有监督微调等技术实现人类意图对齐,具备问答、多轮对话、代码生成功能的中英双语大模型。

[官方网站]

8. 天工大模型--昆仑万维

天工作为一款大型语言模型,拥有强大的自然语言处理和智能交互能力,能够实现智能问答、聊天互动、文本生成等多种应用场景,并且具有丰富的知识储备,涵盖科学、技术、文化、艺术、历史等领域。

[官方网站]

9. 序列猴子大模型--出门问问

序列猴子大模型是一个具有长序列、多模态、单模型、大数据等特点的超大规模语言模型,基于其通用的表示能力与推理能力,能够进行多轮交互,打造更便捷流畅的用户体验,极大地提高了生产效率和数据处理能力,被广泛应用于问答系统、自然语言处理、机器翻译、文本摘要等领域。

[官方网站]

10. MOSS--复旦大学

MOSS是复旦大学自然语言处理实验室发布的国内第一个对话式大型语言模型

[官方网站]

11. 360智脑大模--360

360智脑的生成与创作、多轮对话、代码能力、阅读理解、逻辑与推理、多模态等十大核心能力可覆盖大模型全部应用场景。

[官方网站]

12. 曹植GPT大语言模型--达观数据

达观数据积极探索大语言模型LLM的实践,研发国产版GPT"曹植"系统,作为垂直、专用、自主可控的国产版ChatGPT模型,不仅实现专业领域的AIGC智能化应用,且可内置在客户各类业务系统中提供专用服务

[官方网站]

13. 日日新--商汤

商汤"日日新SenseNova"大模型体系,正式问世

不仅展示了大模型体系下的语言大模型,还展示了AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型及应用,还揭开了依托商汤AI大装置SenseCore实现"大模型+大算力"融合创新的研发体系。

[官方网站]

14. 天燕大模型--APUS

天燕大模型是APUS公司自研的多模态大模型(LMM),具备对文本、图像、视频、音频的理解和生成能力(视频和音频的能力即将推出)。

[官方网站]

15. 元乘象--智子引擎

图文机器人

[官方网站]

16. 西湖大模型--西湖心辰

[官方网站]

17. Dongni--深思考

AI多模态搜索引擎

[官方网站]

18. 山海大模型--云知声

只需一次对话即可获取信息、知识和灵感,解决需求。是每个人身边的助理、朋友和专家。

[官方网站]

19. MiniMax大模型--MiniMax

MiniMax 最新一代的中文大语言模型帮助人类高效写作、激发创意、获取知识、做出决策现已对企业开放API体验

[官方网站]

[[Back to Top](#Back to Top)]

开源模型库平台

  1. 🤗HuggingFace: The AI community building the future.
  1. ModelScope: ModelScope平台是以模型为中心的模型开源社区
  1. flagopen: flagopen飞智大模型技术开源体系
  1. 始智AI: 中国AI开源创新社区

[[Back to Top](#Back to Top)]

开源数据集库

  1. huggfaceing数据集仓库: https://huggingface.co/datasets
  • 包含了自然语言处理、计算机视觉、语音、多模态等数据集,内置100多个多语言公共数据集下载
  1. ModelScope数据集仓库:https://modelscope.cn/datasets
  • 提供了覆盖自然语言处理、计算机视觉、语音、多模态等数据集,更有阿里巴巴集团贡献的专业领域数据集,
  1. flagopen数据集仓库: https://data.baai.ac.cn/data
  • 内置公共数据集下载,可下200G大规模预训练语料WuDaoCorpora
  1. cluebenchmarks数据集仓库:https://www.cluebenchmarks.com/dataSet_search.html
  • 多个中英文NLP数据集,并可申请下载100GB的高质量中文预训练语料CLUECorpus2020
  1. MNBVC: Massive Never-ending BT Vast Chinese corpus
  • 超大规模中文语料集
  1. OpenDataLab数据集仓库: https://opendatalab.com/
  • OpenDataLab 是有影响力的数据开源开放平台,公开数据集触手可及。
  1. OSCAR: Open Super-large Crawled Aggregated coRpus, 多语言数据集
  • 最新版本包含1.4T的中文语言数据集

参考链接

https://github.com/lonePatient/awesome-pretrained-chinese-nlp-models

相关推荐
Alluxio11 分钟前
选择Alluxio来解决AI模型训练场景数据访问的五大理由
大数据·人工智能·分布式·ai·语言模型
AIPaPerPass写论文18 分钟前
写论文去哪个网站?2024最佳五款AI毕业论文学术网站
人工智能·深度学习·chatgpt·powerpoint·ai写作
唯创知音19 分钟前
电子烟智能化创新体验:WTK6900P语音交互芯片方案,融合频谱计算、精准语音识别与流畅音频播报
人工智能·单片机·物联网·音视频·智能家居·语音识别
5pace41 分钟前
PyTorch深度学习快速入门教程【土堆】基础知识篇
人工智能·pytorch·深度学习
aWty_1 小时前
机器学习--卷积神经网络(包括python实现)
人工智能·机器学习·cnn
wx7408513261 小时前
小琳AI课堂:大语言模型如何符合伦理限制
人工智能·语言模型·自然语言处理
5pace1 小时前
机器学习(西瓜书)第 14 章 概率图模型
人工智能·机器学习
Linux猿1 小时前
828华为云征文 | 云服务器Flexus X实例:部署 AgentOps,全方位监测智能体
人工智能·华为云·agent·autogen·flexus云服务器x实例·华为云服务器·agentops
Rense12 小时前
开源RK3588 AI Module7,并与Jetson Nano生态兼容的低功耗AI模块
人工智能·开源
FL16238631292 小时前
[数据集][目标检测]不同颜色的安全帽检测数据集VOC+YOLO格式7574张5类别
人工智能·yolo·目标检测