Day-0支持 | 摩尔线程适配商汤日日新SenseNova U1系列原生理解生成统一模型

今日，摩尔线程旗舰级训推一体全功能智算卡MTT S5000率先完成对商汤日日新SenseNova U1 系列原生理解生成统一模型的Day-0极速适配，再次验证了国产全功能GPU对新型多模态模型的快速、稳定支撑能力。

商汤日日新推出的 SenseNova U1是一款基于商汤从底层逻辑自主研发的NEO-Unify原生统一架构的理解生成统一模型。NEO-Unify 彻底摒弃了主流的拼接式架构，去除了视觉编码器（Visual Encoder, VE）和变分自编码器（Variational Auto-Encoder, VAE），并以统一表征取而代之，在保留语义丰富性的同时维持像素级视觉保真度，这使得语言与视觉信息能够作为一个统一的复合体被直接建模。

SenseNova U1实现了语言和视觉信息的高效协同，让理解与生成能力同步增强，仅凭8B-MoT的较小规格，就能达到甚至超越部分大型商业闭源模型，实现"以小搏大"。模型摆脱了以往模型"先写文字、后配图"的割裂模式，自动生成中间示意图，将复杂逻辑可视化，实现推理过程中的"带图思考"；同时具备强大的信息图生成能力，能够生成信息密集型内容，将复杂信息浓缩成"一图读懂"。

针对上述模型特点，摩尔线程技术团队基于MUSA架构完成了深度适配，核心技术优势包括：

**▼**强大的生态兼容性，加速新架构落地

NEO-Unify架构对底层软件栈的灵活性和扩展性提出了更高要求。摩尔线程凭借具有高度兼容性的MUSA软件生态，能够快速完成对新型模型结构的迁移与适配。同时，摩尔线程原生支持LightX2V推理框架，相比传统基于Hugging Face Transformers的加载方式，可显著提升推理性能，实现更高效、更平滑的模型迁移体验。

▼ 高算力+大显存：夯实多模态推理的硬件底座

SenseNova U1在推理过程中需同步处理高吞吐文本流与高分辨率图像生成，对计算密度提出极高要求。摩尔线程MTT S5000是专为大模型训练、推理及高性能计算而设计的全功能GPU智算卡，基于第四代MUSA架构"平湖"打造。其单卡AI算力最高可达1000 TFLOPS，配备80GB显存，完整支持从FP8到FP64的全精度计算，不仅能有效支撑多模态任务对高算力的需求，也为复杂原生统一架构模型的高效部署提供了坚实的硬件支撑。

▼ 高性能算子库：深度优化核心路径，释放极致效率

为充分发挥硬件潜力，摩尔线程依托自研的muDNN高性能计算库与开源MATE算子库，针对 SenseNova U1的关键计算模块（如 FlashAttention)进行了端到端深度优化，显著提升了推理吞吐与能效比。

此次Day-0适配的成功，不仅验证了摩尔线程 MUSA 软件栈对非标准模型架构的强大兼容性与快速响应能力，也凸显了国产GPU在支持下一代AI创新方面的巨大潜力。双方的合作将有力推动 SenseNova U1在教育、科研、智能办公、工业设计等高价值场景中快速部署，为构建从算法、框架到芯片的全链路国产化AI生态树立了新的里程碑。未来，商汤与摩尔线程将持续深化协同，共同探索原生多模态智能的无限可能。