开源大模型源代码

蓝天星空2024-05-31 20:36

开源大模型的源代码可以在多个平台上找到，以下是一些知名的开源大模型及其源代码的获取方式：

**艾伦人工智能研究所的开放大语言模型（Open Language Model，OLMo）**：

提供了完整的模型权重、训练代码、训练日志、消融研究、训练指标和推理代码。
包含了一个高达3T token的预训练开源语料库，以及产生这些训练数据的代码。
提供了四个不同架构、优化器和训练硬件体系下的7B大小的模型，以及一个1B大小的模型，所有模型都在至少2T token上进行了训练。
提供了用于模型推理的代码、训练过程的各项指标以及训练日志<searchIndex index="1" />。

**BERT**：

BERT项目的源代码可以在GitHub上找到，地址为：https://github.com/google-research/bert#fine-tuning-with-bert\<searchIndex index="2" />。

**ELMo**：

ELMO的源代码可以在GitHub上找到，地址为：https://github.com/allenai/allennlp\<searchIndex index="2" />。

**蚂蚁集团的CodeFuse**：

CodeFuse是一个代码大模型，已经开源，可以在HuggingFace下载模型。
开源内容包括代码框架、模型等，其中模型包括CodeFuse-13B、CodeFuse-CodeLlaMa34B-MFT两个大模型。

**DeepSeek Coder**：

DeepSeek Coder是一个智能代码助手，可以在Hugging Face和GitHub上开源。
在国际权威数据集的测试中表现出色<searchIndex index="3" />。

**LLaMA**：

LLaMA的源码可以在transformers仓库中找到，地址为：https://github.com/huggingface/transformers\<searchIndex index="4" />。

请注意，获取开源大模型的源代码时，需要遵守相应的许可协议，并在使用时引用原始来源。同时，由于开源项目的更新和维护可能会发生变化，建议直接访问上述提供的链接以获取最新的源代码和相关信息。

上一篇：【GD32】05 - PWM 脉冲宽度调制

下一篇：八皇后问题

热门推荐

01GitHub 镜像站点 02【OpenClaw 本地实战 Ep.3】突破瓶颈：强制修改 openclaw.json 解锁 32k 上下文记忆 03OpenClaw 使用和管理 MCP 完全指南 04OpenClaw + 飞书（Feishu）环境搭建指南 05Clawdbot部署教程：解决‘gateway token missing’授权问题的完整步骤 06OpenClaw优化飞书API 额度已耗尽问题 07Window 10部署openclaw报错node.exe : npm error code 128 08Claude Code + GLM4.7 避坑指南：解决 Unable to connect to Anthropic services 09OpenClaw 接入阿里云百炼 Coding Plan 指南 10本地部署 OpenClaw + DeepSeek-R1 完全指南