开源大模型源代码

开源大模型的源代码可以在多个平台上找到,以下是一些知名的开源大模型及其源代码的获取方式:

  1. **艾伦人工智能研究所的开放大语言模型(Open Language Model,OLMo)**:
  • 提供了完整的模型权重、训练代码、训练日志、消融研究、训练指标和推理代码。

  • 包含了一个高达3T token的预训练开源语料库,以及产生这些训练数据的代码。

  • 提供了四个不同架构、优化器和训练硬件体系下的7B大小的模型,以及一个1B大小的模型,所有模型都在至少2T token上进行了训练。

  • 提供了用于模型推理的代码、训练过程的各项指标以及训练日志<searchIndex index="1" />。

  1. **BERT**:
  1. **ELMo**:
  1. **蚂蚁集团的CodeFuse**:
  • CodeFuse是一个代码大模型,已经开源,可以在HuggingFace下载模型。

  • 开源内容包括代码框架、模型等,其中模型包括CodeFuse-13B、CodeFuse-CodeLlaMa34B-MFT两个大模型。

  1. **DeepSeek Coder**:
  • DeepSeek Coder是一个智能代码助手,可以在Hugging Face和GitHub上开源。

  • 在国际权威数据集的测试中表现出色<searchIndex index="3" />。

  1. **LLaMA**:

请注意,获取开源大模型的源代码时,需要遵守相应的许可协议,并在使用时引用原始来源。同时,由于开源项目的更新和维护可能会发生变化,建议直接访问上述提供的链接以获取最新的源代码和相关信息。

相关推荐
数式Oinone13 小时前
继荣获GitCode G-Star认证后,数式Oinone入选2025年GitCode百大开源项目
低代码·开源·低代码平台·gitcode·数式oinone
DisonTangor13 小时前
FIBO是首个基于长结构化描述训练、专为JSON设计的开源文本生成图像模型。
语言模型·自然语言处理·ai作画·开源
亲爱的马哥14 小时前
开源推荐 | TDuck 社区版 — 企业级表单系统分享
开源
数式Oinone14 小时前
社区投稿 | Oinone应用于整车制造供应链决策
低代码·开源·制造·低代码平台·数式oinone
纵有疾風起14 小时前
C++—vector:vecor使用及模拟实现
开发语言·c++·经验分享·开源·stl·vector
CoderJia程序员甲16 小时前
GitHub 热榜项目 - 日榜(2025-11-12)
ai·开源·大模型·github·ai教程
算家计算16 小时前
PaddleOCR-VL-vLLM-OpenAI-API使用教程来了!手把手教你搞定文档解析
人工智能·开源
迦蓝叶18 小时前
Apache Jena 知识图谱持久化:选择适合你的存储方案
人工智能·开源·apache·知识图谱·持久化·存储·jena
q***985220 小时前
开源企业级报表系统SpringReport
开源
FreeBuf_21 小时前
GlassWorm蠕虫卷土重来:开源安全体系暴露根本性缺陷
安全·开源