开源大模型源代码

开源大模型的源代码可以在多个平台上找到,以下是一些知名的开源大模型及其源代码的获取方式:

  1. **艾伦人工智能研究所的开放大语言模型(Open Language Model,OLMo)**:
  • 提供了完整的模型权重、训练代码、训练日志、消融研究、训练指标和推理代码。

  • 包含了一个高达3T token的预训练开源语料库,以及产生这些训练数据的代码。

  • 提供了四个不同架构、优化器和训练硬件体系下的7B大小的模型,以及一个1B大小的模型,所有模型都在至少2T token上进行了训练。

  • 提供了用于模型推理的代码、训练过程的各项指标以及训练日志<searchIndex index="1" />。

  1. **BERT**:
  1. **ELMo**:
  1. **蚂蚁集团的CodeFuse**:
  • CodeFuse是一个代码大模型,已经开源,可以在HuggingFace下载模型。

  • 开源内容包括代码框架、模型等,其中模型包括CodeFuse-13B、CodeFuse-CodeLlaMa34B-MFT两个大模型。

  1. **DeepSeek Coder**:
  • DeepSeek Coder是一个智能代码助手,可以在Hugging Face和GitHub上开源。

  • 在国际权威数据集的测试中表现出色<searchIndex index="3" />。

  1. **LLaMA**:

请注意,获取开源大模型的源代码时,需要遵守相应的许可协议,并在使用时引用原始来源。同时,由于开源项目的更新和维护可能会发生变化,建议直接访问上述提供的链接以获取最新的源代码和相关信息。

相关推荐
勇气要爆发4 小时前
科技爱好者周刊(第 4 期):开源模型的“双响炮“:一周两款国产大模型开源
科技·开源
X.AI6667 小时前
小米 MiMo‑V2.5 正式开源,Orbit 百万亿 Token 激励计划开放申请,速来撸资源
开源
redreamSo8 小时前
让AI Agent自动接Issue、写代码、上线:我用200行代码搭了一个全自动开发流水线
人工智能·开源·github
sinovoip9 小时前
香蕉派开源社区联合进迭进空重磅打造: BPI‑SM10(K3-Com260) 和 K3 Pico‑ITX 计算机将于5月11日全球发货
人工智能·开源·risc-v
FIT2CLOUD飞致云9 小时前
飞致云开源社区月度动态报告(2026年4月)
开源·飞致云·月度报告·开源报告
胖虎喜欢静香10 小时前
从零到一快速实现 Mini DeepResearch
人工智能·python·开源
花间相见10 小时前
【大模型推理01】—— 初探VLLM:高性能LLM推理引擎,让开源模型跑起来更快更省
开源·vllm
redreamSo11 小时前
一个只有70行的文件,凭什么拿下GitHub 10万星?
人工智能·开源
鹏子训12 小时前
Free-Programming-Books 开源资源库快速上手指南
开源