蚂蚁开源万亿参数大模型Ling-1T:多项能力全球领先

在国庆假期结束之际,开源领域迎来了全新万亿级语言模型------蚂蚁集团发布通用语言模型Ling-1T,在多项复杂推理基准中取得突破。

今天凌晨,蚂蚁集团正式发布了其百灵大模型Ling 2.0系列的首款旗舰模型------Ling-1T。这个拥有万亿参数规模的通用语言模型,不仅是蚂蚁百灵团队迄今规模最大、能力最强的非思考大模型,更在多项国际权威测试中展现了卓越的性能。

根据官方发布的信息,Ling-1T在有限输出Token条件下,于多项复杂推理基准中取得了SOTA表现。在代码生成、软件开发、竞赛数学、专业数学、逻辑推理等多项高难度测试上,Ling-1T均取得领先成绩,多项指标位居开源模型的榜首。

尤为引人注目的是,在竞赛数学榜单AIME 25的测试中,Ling-1T以更少的Token消耗实现了70.42%的准确率,这一表现甚至优于Gemini-2.5-Pro。这表明其不仅在规模上实现了突破,在推理效率和精度上也达到了国际领先水平。

从技术架构来看,Ling-1T延续了Ling 2.0的架构设计,总参数量达到1T规模,采用混合专家模型架构,每个token激活其中约50B参数。这种设计使得模型在保持强大能力的同时,实现了更高的计算效率。

在训练数据方面,Ling-1T-base在20T+ token高质量、高推理浓度的语料上完成了预训练,支持最高128K上下文窗口。通过"中训练+后训练"的演进式思维链技术,模型的高效推理能力得到了极大提升。

训练过程中,Ling-1T全程采用FP8混合精度训练,这也是目前已知规模最大的使用FP8训练的基座模型。这一技术选择带来了显著的显存节省、更灵活的并行切分策略和15%以上的端到端加速。

此次Ling-1T的发布,正值国产大模型集体爆发期。就在不久前,混元图像3.0刚登顶LMArena文生图榜单,展现出国产大模型在国际竞技场上的竞争力。而今Ling-1T的优异表现,进一步印证了国产大模型技术实力的全面提升。

目前,模型已在Huggingface、ModelScope等主流开源平台发布,同时提供了面向国内用户的Ling chat体验页面和面向海外开发者的ZenMux平台支持。这种全面开放的态度,将加速模型在各类实际场景中的应用落地。

从行业视角来看,Ling-1T的成功开发体现了中国AI企业在大型语言模型领域的深厚积累。不仅在模型规模上达到万亿级别,更在训练技术、推理效率和应用性能等多个维度实现了均衡突破。

不难看出,大模型的发展正在从单纯追求参数规模,转向更加注重实用性能与效率的平衡。Ling-1T在有限输出Token条件下取得的优异表现,正是这一趋势的体现。这意味着模型在实际应用场景中能够以更低的计算成本,提供更高质量的推理结果。

随着Ling-1T的开源,开发者和研究机构可以基于这一先进模型,开展更多面向特定领域的微调和应用开发。这将有力推动AI技术在各行各业的深度融合,加速智能化转型进程。

在国际竞争格局方面,中国大模型正在形成集群优势。蚂蚁集团此次发布Ling-1T,不仅丰富了自身的大模型产品矩阵,也为整个开源社区注入了新的活力。

随着更多像Ling-1T这样的先进模型走向开源,全球AI开发者将获得更加多样化的技术选择,这对于构建健康、多元的全球AI生态系统具有重要意义。

相关推荐
晟诺数字人2 分钟前
2026年海外直播变革:数字人如何改变游戏规则
大数据·人工智能·产品运营
蛋王派2 分钟前
DeepSeek-OCR-v2 模型解析和部署应用
人工智能·ocr
禁默8 分钟前
基于CANN的ops-cv仓库-多模态场景理解与实践
人工智能·cann
禁默16 分钟前
【硬核入门】无需板卡也能造 AI 算子?深度玩转 CANN ops-math 通用数学库
人工智能·aigc·cann
敏叔V58721 分钟前
AI智能体的工具学习进阶:零样本API理解与调用
人工智能·学习
徐小夕@趣谈前端30 分钟前
拒绝重复造轮子?我们偏偏花365天,用Vue3写了款AI协同的Word编辑器
人工智能·编辑器·word
阿里云大数据AI技术31 分钟前
全模态、多引擎、一体化,阿里云DLF3.0构建Data+AI驱动的智能湖仓平台
人工智能·阿里云·云计算
陈天伟教授31 分钟前
人工智能应用- 语言理解:05.大语言模型
人工智能·语言模型·自然语言处理
池央33 分钟前
CANN GE 深度解析:图编译器的核心优化策略、执行流调度与模型下沉技术原理
人工智能·ci/cd·自动化
酷酷的崽79835 分钟前
CANN 开源生态特别篇:通过 ONNX 实现跨框架高性能推理
开源