商汤发布SenseNova 6.7 Flash-Lite：原生多模态架构打破“视觉转文本“瓶颈，Token消耗直降 60%

商汤科技2026年 5 月 8 日正式推出新一代轻量化多模态智能体模型------日日新 SenseNova 6.7 Flash-Lite。该模型采用原生多模态架构，取消传统"视觉转文本"中间层，实现"看、想、做"一体化，在信息搜索等场景中 Token 消耗较纯文本智能体降低约 60%，并以毫秒级响应适配高频互动生产环境。

人工智能领域的竞争正从"大参数"向"轻量化与高效率"快速演进。商汤科技此次推出的 SenseNova 6.7 Flash-Lite，专为"真实世界工作流"设计，试图打破传统智能体在处理复杂长链路任务时的瓶颈。

原生多模态架构：从"拼接"到"一体"

传统智能体模型多采用"语言+视觉"拼接设计，视觉信息仅作为文本补充，需经过"视觉转文本"中间环节处理。这种设计导致信息在"转译"过程中受损，且伴随着高昂的 Token 消耗。

SenseNova 6.7 Flash-Lite 改变了这一链路。它采用原生多模态架构，能够像人类一样直接"看懂"复杂的网页布局、文档结构与财务图表，无需中间转换环节。这种"看、想、做"一体化的机制，让模型在数据分析、深度调研及 PPT 自动化生成等高难度办公场景中，表现出极高的成功率。

官方数据显示，在权威智能体基准测试中，该模型以更小的参数量取得同级别多项 SOTA（最佳性能表现）。

效率与成本：Token 消耗直降 60%

在实际生产应用中，效率与成本是企业关注的重难点。由于取消了视觉转文本中间层，SenseNova 6.7 Flash-Lite 在保持较小参数规模的同时，智能体能力达到同级别领先水平。

在信息搜索等高频互动场景下，其 Token 消耗量较纯文本智能体降低了约 60%，并能实现毫秒级的响应反馈，更符合生产环境需求。这意味着企业可以用更低的成本运行更多智能体任务，大幅提升投入产出比。

降低门槛：Token Plan 限时免费与 Skills 开源

为降低开发者准入门槛并繁荣生态，商汤同步启动了两项举措：

SenseNova Token Plan 限时免费：参与活动的开发者在首月可获得每 5 小时刷新一次、共计 1500 次的无门槛调用额度，覆盖 SenseNova 6.7 Flash-Lite 及 SenseNova U1 Fast 等系列模型。
SenseNova-Skills GitHub 开源：商汤将模型的核心办公技能封装为 Skills，在 GitHub 平台开源，助力开发者更便捷地构建高性能智能体应用。

商汤首席科学家此前表示，公司将以"成本取胜"策略参与 AI 竞争，模型效率同样出色。Flash-Lite 版本的推出，正是这一战略的具体落地，瞄准对推理成本敏感的企业应用场景。

文章来源：AITOP100，原文地址：https://www.aitop100.cn/infomation/details/33777.html