今日,摩尔线程旗舰级训推一体全功能智算卡MTT S5000率先完成对商汤日日新SenseNova U1 系列原生理解生成统一模型的Day-0极速适配,再次验证了国产全功能GPU对新型多模态模型的快速、稳定支撑能力。
商汤日日新推出的 SenseNova U1是一款基于商汤从底层逻辑自主研发的NEO-Unify原生统一架构的理解生成统一模型。NEO-Unify 彻底摒弃了主流的拼接式架构,去除了视觉编码器(Visual Encoder, VE)和变分自编码器(Variational Auto-Encoder, VAE),并以统一表征取而代之,在保留语义丰富性的同时维持像素级视觉保真度,这使得语言与视觉信息能够作为一个统一的复合体被直接建模。
SenseNova U1实现了语言和视觉信息的高效协同,让理解与生成能力同步增强,仅凭8B-MoT的较小规格,就能达到甚至超越部分大型商业闭源模型,实现"以小搏大"。模型摆脱了以往模型"先写文字、后配图"的割裂模式,自动生成中间示意图,将复杂逻辑可视化,实现推理过程中的"带图思考";同时具备强大的信息图生成能力,能够生成信息密集型内容,将复杂信息浓缩成"一图读懂"。
针对上述模型特点,摩尔线程技术团队基于MUSA架构完成了深度适配,核心技术优势包括:
**▼**强大的生态兼容性,加速新架构落地
NEO-Unify架构对底层软件栈的灵活性和扩展性提出了更高要求。摩尔线程凭借具有高度兼容性的MUSA软件生态,能够快速完成对新型模型结构的迁移与适配。同时,摩尔线程原生支持LightX2V推理框架,相比传统基于Hugging Face Transformers的加载方式,可显著提升推理性能,实现更高效、更平滑的模型迁移体验。
▼ 高算力+大显存:夯实多模态推理的硬件底座
SenseNova U1在推理过程中需同步处理高吞吐文本流与高分辨率图像生成,对计算密度提出极高要求。摩尔线程MTT S5000是专为大模型训练、推理及高性能计算而设计的全功能GPU智算卡,基于第四代MUSA架构"平湖"打造。其单卡AI算力最高可达1000 TFLOPS,配备80GB显存,完整支持从FP8到FP64的全精度计算,不仅能有效支撑多模态任务对高算力的需求,也为复杂原生统一架构模型的高效部署提供了坚实的硬件支撑。
▼ 高性能算子库:深度优化核心路径,释放极致效率
为充分发挥硬件潜力,摩尔线程依托自研的muDNN高性能计算库与开源MATE算子库,针对 SenseNova U1的关键计算模块(如 FlashAttention)进行了端到端深度优化,显著提升了推理吞吐与能效比。
此次Day-0适配的成功,不仅验证了摩尔线程 MUSA 软件栈对非标准模型架构的强大兼容性与快速响应能力,也凸显了国产GPU在支持下一代AI创新方面的巨大潜力。双方的合作将有力推动 SenseNova U1在教育、科研、智能办公、工业设计等高价值场景中快速部署,为构建从算法、框架到芯片的全链路国产化AI生态树立了新的里程碑。未来,商汤与摩尔线程将持续深化协同,共同探索原生多模态智能的无限可能。