在国庆假期结束之际,开源领域迎来了全新万亿级语言模型------蚂蚁集团发布通用语言模型Ling-1T,在多项复杂推理基准中取得突破。
今天凌晨,蚂蚁集团正式发布了其百灵大模型Ling 2.0系列的首款旗舰模型------Ling-1T。这个拥有万亿参数规模的通用语言模型,不仅是蚂蚁百灵团队迄今规模最大、能力最强的非思考大模型,更在多项国际权威测试中展现了卓越的性能。

根据官方发布的信息,Ling-1T在有限输出Token条件下,于多项复杂推理基准中取得了SOTA表现。在代码生成、软件开发、竞赛数学、专业数学、逻辑推理等多项高难度测试上,Ling-1T均取得领先成绩,多项指标位居开源模型的榜首。

尤为引人注目的是,在竞赛数学榜单AIME 25的测试中,Ling-1T以更少的Token消耗实现了70.42%的准确率,这一表现甚至优于Gemini-2.5-Pro。这表明其不仅在规模上实现了突破,在推理效率和精度上也达到了国际领先水平。

从技术架构来看,Ling-1T延续了Ling 2.0的架构设计,总参数量达到1T规模,采用混合专家模型架构,每个token激活其中约50B参数。这种设计使得模型在保持强大能力的同时,实现了更高的计算效率。

在训练数据方面,Ling-1T-base在20T+ token高质量、高推理浓度的语料上完成了预训练,支持最高128K上下文窗口。通过"中训练+后训练"的演进式思维链技术,模型的高效推理能力得到了极大提升。
训练过程中,Ling-1T全程采用FP8混合精度训练,这也是目前已知规模最大的使用FP8训练的基座模型。这一技术选择带来了显著的显存节省、更灵活的并行切分策略和15%以上的端到端加速。
此次Ling-1T的发布,正值国产大模型集体爆发期。就在不久前,混元图像3.0刚登顶LMArena文生图榜单,展现出国产大模型在国际竞技场上的竞争力。而今Ling-1T的优异表现,进一步印证了国产大模型技术实力的全面提升。
目前,模型已在Huggingface、ModelScope等主流开源平台发布,同时提供了面向国内用户的Ling chat体验页面和面向海外开发者的ZenMux平台支持。这种全面开放的态度,将加速模型在各类实际场景中的应用落地。
从行业视角来看,Ling-1T的成功开发体现了中国AI企业在大型语言模型领域的深厚积累。不仅在模型规模上达到万亿级别,更在训练技术、推理效率和应用性能等多个维度实现了均衡突破。
不难看出,大模型的发展正在从单纯追求参数规模,转向更加注重实用性能与效率的平衡。Ling-1T在有限输出Token条件下取得的优异表现,正是这一趋势的体现。这意味着模型在实际应用场景中能够以更低的计算成本,提供更高质量的推理结果。
随着Ling-1T的开源,开发者和研究机构可以基于这一先进模型,开展更多面向特定领域的微调和应用开发。这将有力推动AI技术在各行各业的深度融合,加速智能化转型进程。
在国际竞争格局方面,中国大模型正在形成集群优势。蚂蚁集团此次发布Ling-1T,不仅丰富了自身的大模型产品矩阵,也为整个开源社区注入了新的活力。
随着更多像Ling-1T这样的先进模型走向开源,全球AI开发者将获得更加多样化的技术选择,这对于构建健康、多元的全球AI生态系统具有重要意义。