开源大模型源代码

开源大模型的源代码可以在多个平台上找到,以下是一些知名的开源大模型及其源代码的获取方式:

  1. **艾伦人工智能研究所的开放大语言模型(Open Language Model,OLMo)**:
  • 提供了完整的模型权重、训练代码、训练日志、消融研究、训练指标和推理代码。

  • 包含了一个高达3T token的预训练开源语料库,以及产生这些训练数据的代码。

  • 提供了四个不同架构、优化器和训练硬件体系下的7B大小的模型,以及一个1B大小的模型,所有模型都在至少2T token上进行了训练。

  • 提供了用于模型推理的代码、训练过程的各项指标以及训练日志<searchIndex index="1" />。

  1. **BERT**:
  1. **ELMo**:
  1. **蚂蚁集团的CodeFuse**:
  • CodeFuse是一个代码大模型,已经开源,可以在HuggingFace下载模型。

  • 开源内容包括代码框架、模型等,其中模型包括CodeFuse-13B、CodeFuse-CodeLlaMa34B-MFT两个大模型。

  1. **DeepSeek Coder**:
  • DeepSeek Coder是一个智能代码助手,可以在Hugging Face和GitHub上开源。

  • 在国际权威数据集的测试中表现出色<searchIndex index="3" />。

  1. **LLaMA**:

请注意,获取开源大模型的源代码时,需要遵守相应的许可协议,并在使用时引用原始来源。同时,由于开源项目的更新和维护可能会发生变化,建议直接访问上述提供的链接以获取最新的源代码和相关信息。

相关推荐
说私域5 小时前
基于开源AI智能名片链动2 + 1模式S2B2C商城小程序的沉浸式体验营销研究
人工智能·小程序·开源·零售
搬码临时工5 小时前
本地主机部署开源企业云盘Seafile并实现外部访问
开源
GitCode官方5 小时前
G-Star公益行 | 公益组织入门开源技术,六月北京点燃改变的星火
开源
深圳亥时科技12 小时前
综合治理系统(源码+文档+讲解+演示)
开源
极客BIM工作室1 天前
OCCT基础类库介绍: Foundation Classes - Basics
开源
2301_794333911 天前
Maven 概述、安装、配置、仓库、私服详解
java·开发语言·jvm·开源·maven
路边的阿不1 天前
「墨探」是如何使用插件机制构建可扩展架构的
开源
烈焰晴天1 天前
一款用于react-native监听app[AppState]前后台的自定义Hooks开源插件
开源
NocoBase1 天前
开发者推荐:6 款更灵活的 Firebase 开源替代品
低代码·开源·资讯
深圳亥时科技1 天前
家政到家服务平台(源码+文档+讲解+演示)
开源