网易伏羲亮相Arm Unlocked 2025，携手Arm探索中国人工智能创新之路

9月10日，Arm Unlocked 2025成功召开。作为崭新的AI计算与创新的盛会，Arm Unlocked 2025汇聚科技企业、芯片合作伙伴、OEM/ODM厂商、生态系统领导者等，共同探索AI计算的未来。大会期间，网易伏羲实验室AI算法部负责人吕唐杰博士 受邀出席，在关键对话环节分享了"游戏+AI"的前沿探索及实践，资深强化学习技术专家关凯在技术专场带来了"从云到端：游戏AI推理加速的探索与创新"的主题演讲。

1、Arm"关键对话"：探索中国人工智能创新之路

关键对话环节以"在Arm平台携手共创中国人工智能创新之路"为主题，吕唐杰博士与阿里云飞天实验室研究员杨镔博士、安谋科技（Arm China）CEO陈锋展开对话，就AI技术演进、"游戏+AI"方向与生态共建等议题分享深刻洞察。

在大语言模型支撑的游戏领域，吕唐杰博士分享，第三方调研显示，中国玩家对AI技术的接受度较高，尤其在内容创作与社交分享上意愿显著。基于此，网易伏羲实验室深耕"游戏+AI "，整合大语言模型（LLM）、多模态语音交互、动作生成与强化学习（RL）等技术，推出**《逆水寒》手游智能NPC** 、UGC剧组模式 、《永劫无间》手游AI队友等多项行业首创功能。此外，伏羲实验室与Arm等硬件伙伴合作优化端侧AI计算效能，通过联合研发构建更适配的计算底座，为探索下一代AI游戏体验提供坚实的技术支撑。

2、技术专场演讲：游戏AI推理加速的探索与创新

在技术专场上，关凯介绍了网易伏羲在游戏AI推理加速领域的前沿探索与实践成果。针对动作类及体育竞技类游戏中AI机器人对高性能、低延迟的严苛需求，团队创新性地将AI模型从云端迁移至终端设备部署，显著降低了响应延迟并优化了资源消耗，为玩家带来更流畅、沉浸的游戏体验。

《永劫无间》手游与《全明星街球派对》等强对抗性游戏要求极低的响应延迟与高频帧率，同时需兼容包括老旧型号在内的多种硬件设备。然而，端侧部署长期面临三大挑战：单帧推理延时高 、内存与安装包体积限制 ，以及高功耗引发的设备发热和性能下降。

为应对上述挑战，网易伏羲构建了一套完整落地方案，实现了从云端训练到端侧部署的高效闭环 。在模型优化 方面，团队采用"三板斧"策略：通过结构替换与剪枝减少推理耗时；以FP16压缩/权值量化降低存储与内存占用；借助在线蒸馏技术将大模型能力迁移至轻量化模型，在保障效果的同时大幅压缩模型体积。在集成与优化层面，通过错帧执行与多线程调度，充分利用设备的多核性能，保证单帧消耗足够小，显著提升了游戏流畅度。

实践应用表明，该方案成效显著。借助KleidiAI加速，端侧推理速度提升至原有的1.97至2.63倍 ；通过FP16压缩与量化技术，模型体积减少了最多28.25M ，运行时内存占用也得到有效控制。目前，相关技术已成功应用于《永劫无间》手游与《全明星街球派对》，不仅实现了低延迟、高拟人度的AI对手与队友功能，还支持动态难度调整与玩家语音指令交互，进一步丰富了游戏体验。

3、结语

AI浪潮下，高性能、高能效且具备出色安全性的Arm架构正持续释放AI潜能，网易伏羲通过深化"游戏+AI"融合创新，不仅推动了智能NPC、低延迟推理等前沿技术落地，更与Arm等伙伴协同优化端侧效能，为中国AI产业的自主创新与生态共建提供了重要实践范本。未来，双方将继续携手探索技术边界，共同推动中国人工智能事业迈向全球前沿。