Grok-2的Beta版发布

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/

Grok-2是目前最前沿的语言模型，具备顶尖的推理能力。这次发布包含了Grok家族的两名成员：Grok-2和Grok-2 mini。现在，这两款模型已经在𝕏平台上开放给Grok用户。

此次推出的Grok-2是对之前Grok-1.5的重大升级，展现了在聊天、编程和推理方面的前沿能力。同时，Grok-2 mini作为Grok-2的小型但功能强大的兄弟也一同亮相。Grok-2的早期版本已经以"sus-column-r"的名义在LMSYS排行榜上进行了测试，目前表现优于Claude 3.5 Sonnet和GPT-4-Turbo。

Grok-2和Grok-2 mini目前处于𝕏平台上的Beta测试阶段，并将在本月晚些时候通过企业API向更多用户开放。

Grok-2的语言模型和聊天能力

Grok-2的早期版本以"sus-column-r"的名字进入了LMSYS聊天机器人竞技场，这是一个受欢迎的语言模型基准测试平台。Grok-2在LMSYS排行榜上的Elo评分超越了Claude和GPT-4。

在内部测试中，AI导师与模型进行互动，评估模型在指令执行和信息准确性方面的表现。Grok-2在处理检索内容的推理能力和工具使用方面，表现出显著的进步，能够更好地识别缺失信息、推理事件顺序并排除无关内容。

基准测试

Grok-2在多个学术基准测试中表现出色，包括推理、阅读理解、数学、科学和编程等领域。与之前的Grok-1.5相比，Grok-2和Grok-2 mini在这些测试中取得了显著提升，表现出与其他前沿模型相当的竞争力。在视觉数学推理（MathVista）和基于文档的问答（DocVQA）任务中，Grok-2的表现尤为突出，达到了业界最先进的水平。

在𝕏上体验实时信息的Grok

过去几个月中，Grok在𝕏平台上持续优化。如今，推出了新一代的Grok体验，带来了重新设计的界面和新功能。

𝕏 Premium和Premium+用户将能够使用两款新模型：Grok-2和Grok-2 mini。Grok-2是最先进的AI助手，具有强大的文本和视觉理解能力，能够集成𝕏平台的实时信息。Grok-2 mini则在速度和回答质量之间取得了平衡。与前代相比，Grok-2在各类任务中更加直观、易于操作，无论是寻求答案、协作写作，还是解决编程任务，都表现出色。与Black Forest Labs合作，Grok正在与他们的FLUX.1模型进行实验，扩展其在𝕏平台上的功能。如果是Premium或Premium+订阅者，请确保更新到𝕏应用的最新版本，以便参与Grok-2的Beta测试。

使用企业API构建Grok

本月晚些时候，Grok-2和Grok-2 mini还将通过新的企业API平台开放给开发者使用。新的API平台基于全新的技术架构，支持全球范围的低延迟多区域推理部署，提供了增强的安全功能，如强制多因素认证（如Yubikey、Apple TouchID或TOTP），丰富的流量统计数据，以及高级计费分析（包括详细的数据导出）。此外，还提供了管理API，允许团队、用户和计费管理集成到现有的内部工具和服务中。如果想要获得最新消息，可以订阅我们的新闻简报。

未来展望

Grok-2和Grok-2 mini正在𝕏平台上逐步推出，其应用范围包括增强的搜索功能、更深入的𝕏帖子见解和改进的回复功能，所有这些都由Grok驱动。即将发布的多模态理解功能预览也将成为Grok体验的一部分。

自2023年11月推出Grok-1以来，xAI团队以极高的速度推动着发展。通过引入Grok-2，xAI在AI开发领域占据了领先地位。未来几个月中，更多的进展将陆续公布。