马斯克硬刚OpenAI,开源 Grok:3140 亿为目前最大规模

马斯克之前公开控诉OpenAI并宣布要开源自己的大模型,现在马斯克来兑现承诺了,由X.AI推出的大模型Grok来了。

3月17日凌晨,马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家(MoE)模型「Grok-1」,以及该模型的权重和网络架构。马斯克也在X上和OpenAI进行了亲切地互动。

Grok-1的一些详细情况:

  • 基础模型基于大量文本数据进行训练,没有针对任何具体任务进行微调;
  • 3140 亿参数的 MoE 模型,在给定 token 上的激活权重为 25%;
  • 2023 年 10 月,xAI 使用 JAX 库和 Rust 语言组成的自定义训练堆栈从头开始训练。

当前Grok-1已经在github上开源,并且正以一种难以置信的热度蹿升,马斯克真是在任何领域都能带来巨大的流量。注意看下面star增长速度,是小时为单位的!目前才10多个小时,已经达到了10K star。

Github的仓库包含了用于加载和运行 Grok-1 开放权重模型的 JAX 示例代码。

运行

arduino 复制代码
pip install -r requirements.txt
python run.py

由于模型规模较大(314B参数),需要有足够GPU内存的机器才能使用示例代码测试模型。

Github的仓库里也放出了模型下载的磁力链接,要动手测试的朋友们可以去下载了,296G的大小,大家要提前准备好空间。

xAI 表示,Grok-1 的研发经历了四个月。在此期间,Grok-1 经历了多次迭代。

在公布了 xAI 创立的消息之后,他们训练了一个 330 亿参数的 LLM 原型 ------Grok-0。这个早期模型在标准 LM 测试基准上接近 LLaMA 2 (70B) 的能力,但只使用了一半的训练资源。之后,他们对模型的推理和编码能力进行了重大改进,最终开发出了 Grok-1,这是一款功能更为强大的 SOTA 语言模型,在 HumanEval 编码任务中达到了 63.2% 的成绩,在 MMLU 中达到了 73%。

xAI 使用了一些旨在衡量数学和推理能力的标准机器学习基准对 Grok-1 进行了一系列评估:

在这些基准测试中,Grok-1 显示出了强劲的性能,超过了其计算类中的所有其他模型,包括 ChatGPT-3.5 和 Inflection-1。只有像 GPT-4 这样使用大量训练数据和计算资源训练的模型才能超越它。xAI 表示,这展示了他们在高效训练 LLM 方面取得的快速进展。

最近越来越多的科技巨头开始入局AI,纷纷发布自己的大模型,希望这可以让AI领域更快速的发展,为人类带来更多的收益。

相关推荐
Luke Ewin5 分钟前
从零开始部署Fun-ASR-Nano实时语音识别并区分说话人教程 | 私有化部署开源的实时语音转写项目
人工智能·语音识别·funasr·实时语音识别·fun-asr
跨境技工小黎8 分钟前
Playwright vs Puppeteer :自动化脚本工具全面对比
人工智能
Hotchip_MEMS8 分钟前
韬τ定律的技术内核:逻辑折叠与信息路径重构
人工智能·物联网
AI服务老曹12 分钟前
解耦异构算力:基于 Docker 与 GB28181/RTSP 的边缘计算 AI 视频管理平台架构设计(支持源码交付)
人工智能·docker·边缘计算
captain_AIouo14 分钟前
深耕海外市场,autoAGC攻破品牌跨境内容运营难题
大数据·人工智能·经验分享·产品运营·aigc·内容运营
云天AI实战派17 分钟前
AI 智能体/API 故障排查指南:从调用失败到上线稳定的全流程修复手册
人工智能
KaMeidebaby20 分钟前
卡梅德生物技术快报|Western Blot 实验应用:肺肠轴机制研究全流程技术解析
前端·数据库·人工智能·算法·百度
weixin_4462608522 分钟前
局部相合,全局不一致:多组件大型语言模型智能体中组合不一致性的界定
人工智能·语言模型·概率论
老金带你玩AI23 分钟前
小白速通 Codex App:带录播回放
人工智能
志栋智能23 分钟前
超自动化运维:如何降低人为错误?
大数据·运维·网络·人工智能·自动化