网易伏羲亮相Arm Unlocked 2025,携手Arm探索中国人工智能创新之路

9月10日,Arm Unlocked 2025成功召开。作为崭新的AI计算与创新的盛会,Arm Unlocked 2025汇聚科技企业、芯片合作伙伴、OEM/ODM厂商、生态系统领导者等,共同探索AI计算的未来。大会期间,网易伏羲实验室AI算法部负责人吕唐杰博士 受邀出席,在关键对话环节分享了"游戏+AI"的前沿探索及实践,资深强化学习技术专家关凯在技术专场带来了"从云到端:游戏AI推理加速的探索与创新"的主题演讲。

1、Arm"关键对话":探索中国人工智能创新之路

关键对话环节以"在Arm平台携手共创中国人工智能创新之路"为主题,吕唐杰博士与阿里云飞天实验室研究员杨镔博士、安谋科技(Arm China)CEO陈锋展开对话,就AI技术演进、"游戏+AI"方向与生态共建等议题分享深刻洞察。

在大语言模型支撑的游戏领域,吕唐杰博士分享,第三方调研显示,中国玩家对AI技术的接受度较高,尤其在内容创作与社交分享上意愿显著。基于此,网易伏羲实验室深耕"游戏+AI ",整合大语言模型(LLM)、多模态语音交互、动作生成与强化学习(RL)等技术,推出**《逆水寒》手游智能NPC** 、UGC剧组模式《永劫无间》手游AI队友等多项行业首创功能。此外,伏羲实验室与Arm等硬件伙伴合作优化端侧AI计算效能,通过联合研发构建更适配的计算底座,为探索下一代AI游戏体验提供坚实的技术支撑。

2、技术专场演讲:游戏AI推理加速的探索与创新

在技术专场上,关凯介绍了网易伏羲在游戏AI推理加速领域的前沿探索与实践成果。针对动作类及体育竞技类游戏中AI机器人对高性能、低延迟的严苛需求,团队创新性地将AI模型从云端迁移至终端设备部署,显著降低了响应延迟并优化了资源消耗,为玩家带来更流畅、沉浸的游戏体验。

《永劫无间》手游与《全明星街球派对》等强对抗性游戏要求极低的响应延迟与高频帧率,同时需兼容包括老旧型号在内的多种硬件设备。然而,端侧部署长期面临三大挑战:单帧推理延时高内存与安装包体积限制 ,以及高功耗引发的设备发热和性能下降

为应对上述挑战,网易伏羲构建了一套完整落地方案,实现了从云端训练到端侧部署的高效闭环 。在模型优化 方面,团队采用"三板斧"策略:通过结构替换与剪枝减少推理耗时;以FP16压缩/权值量化降低存储与内存占用;借助在线蒸馏技术将大模型能力迁移至轻量化模型,在保障效果的同时大幅压缩模型体积。在集成与优化层面,通过错帧执行与多线程调度,充分利用设备的多核性能,保证单帧消耗足够小,显著提升了游戏流畅度。

实践应用表明,该方案成效显著。借助KleidiAI加速,端侧推理速度提升至原有的1.97至2.63倍 ;通过FP16压缩与量化技术,模型体积减少了最多28.25M ,运行时内存占用也得到有效控制。目前,相关技术已成功应用于《永劫无间》手游与《全明星街球派对》,不仅实现了低延迟、高拟人度的AI对手与队友功能,还支持动态难度调整与玩家语音指令交互,进一步丰富了游戏体验。

3、结语

AI浪潮下,高性能、高能效且具备出色安全性的Arm架构正持续释放AI潜能,网易伏羲通过深化"游戏+AI"融合创新,不仅推动了智能NPC、低延迟推理等前沿技术落地,更与Arm等伙伴协同优化端侧效能,为中国AI产业的自主创新与生态共建提供了重要实践范本。未来,双方将继续携手探索技术边界,共同推动中国人工智能事业迈向全球前沿。

相关推荐
吴佳浩11 小时前
大模型量化部署终极指南:让700亿参数的AI跑进你的显卡
人工智能·python·gpu
跨境卫士苏苏11 小时前
亚马逊AI广告革命:告别“猜心”,迎接“共创”时代
大数据·人工智能·算法·亚马逊·防关联
珠海西格电力11 小时前
零碳园区工业厂房光伏一体化(BIPV)基础规划
大数据·运维·人工智能·智慧城市·能源
土星云SaturnCloud12 小时前
不止是替代:从机械风扇的可靠性困局,看服务器散热技术新范式
服务器·网络·人工智能·ai
小马爱打代码12 小时前
Spring AI:搭建自定义 MCP Server:获取 QQ 信息
java·人工智能·spring
你们补药再卷啦12 小时前
ai(三)环境资源管理
人工智能·语言模型·电脑
飞哥数智坊12 小时前
GLM-4.6V 初探:国产 AI 能边写边自己配图了
人工智能·chatglm (智谱)
杰克逊的日记13 小时前
大模型的原理是什么
人工智能·大模型·gpu·算力
智算菩萨13 小时前
AI在智能制造中的落地:从预测维护到自适应生产调度
人工智能·制造
云和数据.ChenGuang13 小时前
AI 算力竞争下的昇腾硬件定位
人工智能