还得是马斯克,直接杠!
就在OpenAI发布GPT-5.1没几天,马斯克这边就坐不住了。
刚刚,xAI官宣推出最新版本Grok 4.1,直接面向全球所有用户免费开放。
马斯克本人在X平台上表示,这次更新会让用户"明显感受到速度和质量的双重提升"。

目前,用户可以在Grok网站、X平台,以及iOS和Android应用程序上直接使用Grok 4.1。
更关键的是,这次不是只有付费用户才能体验,所有用户(包括免费用户)都能用上。

这波操作可谓诚意十足!
和前代Grok 4相比,Grok 4.1的整体的增长幅度非常大。
从内部测试的反馈来看,新版本在多个维度都有明显提升,特别是在情感理解、准确性和创意写作方面。
一些早期测试者表示,Grok 4.1的对话风格更自然了,不再像以前那么机械和生硬。

Grok 4.1到底升级在哪?
Grok 4.1这次升级,并不是简单的修修补补,下面就给大家拆解一下它到底厉害在哪儿。
1.幻觉率大幅降低
这是此次升级的亮点之一!所谓幻觉,就是AI模型编造虚假信息的现象。
以前用AI时候,总担心它胡说八道,而Grok 4.1此次在这方面取得了突破性进展。
官方数据显示,幻觉率从前代Grok 4的超过12%骤降至4.22%,估计降了快三倍!

2.情商在线,对话更贴心
Grok 4.1另一个亮眼的地方在于情感理解能力的提升。
在EQ-Bench(情商基准测试)中,Grok 4.1的Elo评分达到了1586,比前代提升了超过100分。
响应速度提升
官方数据显示,Grok 4.1的响应延迟缩短了42%。
简单来说,就是回复速度比以前快了一半多。
不过实际使用中,有用户反馈在"思考模式"下响应时间还是比较长,有时候需要等待几分钟。
毕竟深度推理花费时间长我们也理解。
超长上下文处理
Grok 4.1支持高达25.6万tokens的上下文输入,在特定需求下还可以扩展到200万tokens。
要知道,1个中文字大约对应在1.5-2个tokens。
这意味着,Grok 4.1可以一次性处理相当于几百万字的文本,处理长文档和深度数据分析的能力强大。
Grok 4.1跑分成绩亮眼
在公认的大型语言模型竞技场LMArena上,Grok 4.1可谓是狠狠出了一把风头。
其思考模式版本以1483的Elo评分位列榜首(截至评测时间),大幅领先包括GPT、Gemini、Claude在内的所有竞争对手。

这里需要补充一句,此前的Grok 4在这个榜单上还排在第33位,而现在的Grok 4.1直接跳到榜首。
更厉害的是,即便是它的"非推理模式",也以1465的Elo评分排名第二,甚至超越了其他模型开启完整推理能力后的表现。
在情商测试上,Grok 4.1也表现优异。
在EQ-Bench基准测试 中,它以1586的Elo高分位居前列,比前代模型提升了100多分。

在Creative Writing v3创意写作评测中,Grok 4.1也名列前茅,仅次于GPT-5.1。

而且在为期两周的静默上线测试中,通过与前一版本的盲测对比,Grok 4.1在六成多情况下更受用户青睐。

目前从放出的跑分成绩不难看出,此次Grok 4.1的提升是非常巨大的,特别是在准确性和情感理解两大维度上,Grok的进步十分明显。
对于普通用户来说,最大的福利就是它对所有人免费开放。
你不需要付费,就能体验到目前榜单排名第一的AI模型,这波福利可不小。
不过也要看到,Grok 4.1并非完美无缺。在编程能力和响应速度上,它还有提升空间。
如果你是程序员,或许GPT 5.1和Claude code更加适合你
相关阅读: