开源大模型源代码

开源大模型的源代码可以在多个平台上找到,以下是一些知名的开源大模型及其源代码的获取方式:

  1. **艾伦人工智能研究所的开放大语言模型(Open Language Model,OLMo)**:
  • 提供了完整的模型权重、训练代码、训练日志、消融研究、训练指标和推理代码。

  • 包含了一个高达3T token的预训练开源语料库,以及产生这些训练数据的代码。

  • 提供了四个不同架构、优化器和训练硬件体系下的7B大小的模型,以及一个1B大小的模型,所有模型都在至少2T token上进行了训练。

  • 提供了用于模型推理的代码、训练过程的各项指标以及训练日志<searchIndex index="1" />。

  1. **BERT**:
  1. **ELMo**:
  1. **蚂蚁集团的CodeFuse**:
  • CodeFuse是一个代码大模型,已经开源,可以在HuggingFace下载模型。

  • 开源内容包括代码框架、模型等,其中模型包括CodeFuse-13B、CodeFuse-CodeLlaMa34B-MFT两个大模型。

  1. **DeepSeek Coder**:
  • DeepSeek Coder是一个智能代码助手,可以在Hugging Face和GitHub上开源。

  • 在国际权威数据集的测试中表现出色<searchIndex index="3" />。

  1. **LLaMA**:

请注意,获取开源大模型的源代码时,需要遵守相应的许可协议,并在使用时引用原始来源。同时,由于开源项目的更新和维护可能会发生变化,建议直接访问上述提供的链接以获取最新的源代码和相关信息。

相关推荐
柱子jason2 小时前
我的第一个开源项目【IOT-Tree Server】
物联网·开源·iiot·iot-tree
DO_Community10 小时前
普通服务器都能跑:深入了解 Qwen3-Next-80B-A3B-Instruct
人工智能·开源·llm·大语言模型·qwen
mortimer11 小时前
零依赖、高效率的语音转文字c++版 whisper.cpp (附批量处理脚本)
开源·github
阿里云云原生17 小时前
Spring AI Alibaba Admin 开源!以数据为中心的 Agent 开发平台
开源
隐语SecretFlow17 小时前
我的第一份开源贡献:小米工程师程赛的社区之旅
开源
时光追逐者17 小时前
C#/.NET/.NET Core技术前沿周刊 | 第 58 期(2025年10.13-10.19)
微软·开源·c#·.net·.netcore
猫头虎19 小时前
DeepSeek刚刚开源了一个3B的 OCR模型:什么是DeepSeek-OCR?单张A100-40G每天可以处理20万+页文档
人工智能·开源·whisper·prompt·aigc·ocr·gpu算力
开源能源管理系统20 小时前
MyEMS:用开源撕开能源管理 “黑箱”,让节能不再 “凭感觉”
开源
开源能源管理系统20 小时前
赋能工业 / 商业 / 公共机构:开源 MyEMS,让能源管理 “人人可及”
开源
开源能源管理系统20 小时前
开源能源管理系统 MyEMS:赋能企业降本增效,加速能源数字化转型
开源