商汤发布SenseNova 6.7 Flash-Lite:原生多模态架构打破“视觉转文本“瓶颈,Token消耗直降 60%

商汤科技2026年 5 月 8 日正式推出新一代轻量化多模态智能体模型------日日新 SenseNova 6.7 Flash-Lite。该模型采用原生多模态架构,取消传统"视觉转文本"中间层,实现"看、想、做"一体化,在信息搜索等场景中 Token 消耗较纯文本智能体降低约 60%,并以毫秒级响应适配高频互动生产环境。

人工智能领域的竞争正从"大参数"向"轻量化与高效率"快速演进。商汤科技此次推出的 SenseNova 6.7 Flash-Lite,专为"真实世界工作流"设计,试图打破传统智能体在处理复杂长链路任务时的瓶颈。

原生多模态架构:从"拼接"到"一体"

传统智能体模型多采用"语言+视觉"拼接设计,视觉信息仅作为文本补充,需经过"视觉转文本"中间环节处理。这种设计导致信息在"转译"过程中受损,且伴随着高昂的 Token 消耗。

SenseNova 6.7 Flash-Lite 改变了这一链路。它采用原生多模态架构,能够像人类一样直接"看懂"复杂的网页布局、文档结构与财务图表,无需中间转换环节。这种"看、想、做"一体化的机制,让模型在数据分析、深度调研及 PPT 自动化生成等高难度办公场景中,表现出极高的成功率。

官方数据显示,在权威智能体基准测试中,该模型以更小的参数量取得同级别多项 SOTA(最佳性能表现)。

效率与成本:Token 消耗直降 60%

在实际生产应用中,效率与成本是企业关注的重难点。由于取消了视觉转文本中间层,SenseNova 6.7 Flash-Lite 在保持较小参数规模的同时,智能体能力达到同级别领先水平。

在信息搜索等高频互动场景下,其 Token 消耗量较纯文本智能体降低了约 60%,并能实现毫秒级的响应反馈,更符合生产环境需求。这意味着企业可以用更低的成本运行更多智能体任务,大幅提升投入产出比。

降低门槛:Token Plan 限时免费与 Skills 开源

为降低开发者准入门槛并繁荣生态,商汤同步启动了两项举措:

  1. SenseNova Token Plan 限时免费:参与活动的开发者在首月可获得每 5 小时刷新一次、共计 1500 次的无门槛调用额度,覆盖 SenseNova 6.7 Flash-Lite 及 SenseNova U1 Fast 等系列模型。
  2. SenseNova-Skills GitHub 开源:商汤将模型的核心办公技能封装为 Skills,在 GitHub 平台开源,助力开发者更便捷地构建高性能智能体应用。

商汤首席科学家此前表示,公司将以"成本取胜"策略参与 AI 竞争,模型效率同样出色。Flash-Lite 版本的推出,正是这一战略的具体落地,瞄准对推理成本敏感的企业应用场景。

文章来源:AITOP100,原文地址:https://www.aitop100.cn/infomation/details/33777.html

相关推荐
阿星AI工作室2 小时前
为了听到代码的声音,我vibecoding了一架钢琴丨code piano
人工智能
我这一拳20年的功力2 小时前
剪不断,理还乱?从Vibe到Harness的这些名词
人工智能
不懂的浪漫2 小时前
02|Netty 服务端是怎么启动的:从 ServerBootstrap.bind() 看源码主线
架构·netty
茶马古道的搬运工2 小时前
AI 深度技能之-模型路由(一)-必要性
人工智能
现代野蛮人2 小时前
【深度学习】 —— VGG-16 网络实现猫狗识别
网络·人工智能·python·深度学习·tensorflow
aneasystone本尊2 小时前
让小龙虾分身:多 Agent 路由与 Sub-agents
人工智能
用户5191495848452 小时前
Camaleon CMS 认证本地文件包含 (LFI) 漏洞利用工具
人工智能·aigc
阿里云大数据AI技术2 小时前
PAI部署Hermes Agent全攻略,打造越用越懂你的AI助手
人工智能·agent
一个小猴子`2 小时前
Pytorch快速复习
人工智能·pytorch·python