从无形IP到AI万象,安谋科技Arm China“周易”X3 NPU 发布!

2025 年 11 月 13 日,中国上海讯 - 国内领先的芯片 IP 设计与服务提供商安谋科技(中国)有限公司(以下简称"安谋科技 Arm China")今日宣布,在上海举办"周易"X3 NPU IP 新品发布会。作为安谋科技 Arm China"All in AI"产品战略下诞生的首款重磅产品,以及"AI Arm CHINA"战略发展方向的关键实践,"周易"X3 NPU IP 基于专为大模型而生的最新 DSP+DSA 架构,致力于打造端侧 AI 计算效率新标杆,在性能、功能与易用性等方面全面跃升,面向基础设施、智能汽车、移动终端、智能物联网四大领域,为加速卡、智能座舱、ADAS(高级驾驶辅助系统)、具身智能、AI PC、AI 手机、智能网关、智能 IPC(网络摄像机)等设备带来前所未有的 AI 计算体验。

安谋科技 Arm China 产品研发副总裁刘浩

安谋科技 Arm China 产品研发副总裁刘浩表示:"在'All in AI'产品战略的指引下,我们将持续加大投入,以前瞻性视野整合顶尖研发资源,秉持开放合作理念,为生态伙伴提供业界领先的从硬件、软件到服务的端到端解决方案,全力赋能伙伴的产品创新和商业化落地。"

"周易"X3 NPU IP 新品发布会现场

性能跃迁

前瞻五年布局,让端侧大模型"跑得稳、答得顺"

在半导体 IP 领域,"面向未来 5 年的产品方向进行前瞻布局"已成为行业共识------涵盖 IP 研发、芯片及终端产品研发量产。安谋科技 Arm China 深谙这一规律,前瞻性地在"周易"X3 中采用兼顾 CNN 与 Transformer 的通用架构设计,支持全算力类型并增强浮点运算 FLOPS,助力实现从定点到浮点计算的关键转变,并满足大模型计算需求,为未来 5 年 Gen AI、Agentic AI 与 Physical AI 的端侧落地奠定技术基石。

随着 AI 大模型技术的飞速发展,智能手机、AI PC 和智能汽车等端侧设备正迎来 AI 能力的爆发性需求。从多模态语音助手到实时图像生成,从智能座舱交互到辅助驾驶决策,端侧设备需要承载越来越复杂的 AI 计算任务。然而,端侧 AI 部署面临算力受限、能效要求高、带宽瓶颈、开发门槛高等多重挑战------如何在有限的功耗和算力资源下实现大模型的高效运行,成为行业亟需突破的关键难题。

"周易"X3 基于专为大模型而生的最新 DSP+DSA 架构,从计算效率、带宽、精度适配、任务处理四大维度实现升级,精准解决端侧 AI 大模型运行难题,打造端侧 AI 计算效率的新标杆。

其单 Cluster 最高支持 4 个 Core,拥有 8~80 FP8 TFLOPS 算力且可灵活配置,单 Core 带宽高达 256GB/s。相较于"周易"X2 产品,"周易"X3 的 CNN 模型性能提升 30%~50%,多核算力线性度达到 70%~80%。在同算力规格下,AIGC 大模型能力较上一代产品实现 10 倍增长,这得益于 16 倍的 FP16 TFLOPS、4 倍的计算核心带宽、超过 10 倍的 Softmax 和 LayerNorm 性能提升共同驱动。

借助这些优化,端侧大模型推理将更高效:在 Llama2 7B 大模型实测中,"周易"X3 NPU IP 在 Prefill 阶段算力利用率高达 72%,并在安谋科技 Arm China 自研的解压硬件 WDC 的加持下,实现 Decode 阶段有效带宽利用率超 100%,远超行业平均水平,满足大模型解码阶段的高吞吐需求。

"周易"X3 NPU IP 新品亮点

此外,"周易"X3 在架构层面实现了多项创新,集成以下关键特性:

  • **集成自研解压硬件 WDC:**使大模型 Weight 软件无损压缩后通过硬件解压能获得额外 15%~20% 等效带宽提升。

  • **新增端侧大模型运行必备的 W4A8/W4A16 计算加速模式:**对模型权重进行低比特量化,大幅降低带宽消耗,支持云端大模型向端侧的高效迁移。

  • **集成 AI 专属硬件引擎 AIFF(AI Fixed-Function)与专用硬化调度器:**实现超低至 0.5% 的 CPU 负载与低调度延迟,灵活支持端侧多任务场景和任意优先级调度场景,确保高优先级任务的即时响应。

  • **支持 int4/int8/int16/int32/fp4/fp8/fp16/bf16/fp32 多精度融合计算,强浮点计算:**可灵活适配智能手机边缘部署、AI PC 推理、智能汽车等从传统 CNN 到前沿大模型的数据类型需求,平衡性能与能效。

安谋科技 Arm China 产品总监鲍敏祺

安谋科技 Arm China 产品总监鲍敏祺指出:"'周易'X3 遵循'软硬协同、全周期服务与成就客户'的产品准则,提供从硬件、软件到售后服务的全链路支持,以前瞻性设计、专业团队交付与深度服务投入,全面助力客户产品成功与商业化落地。"

软硬协同

从"好用"到"用好 ",Compass"金牌辅助"提升开发效率

"周易"X3 NPU IP 不仅提供高性能硬件,还配套完善易用的"周易"Compass AI 软件平台,通过"软硬一体"的协同设计,让开发者从"好用"到"用好",显著提升开发部署效率。

Compass AI 软件平台通过覆盖开发全流程的工具链、极致的易用性优化与开放的生态布局,破解端侧 AI 开发"适配难、周期长、门槛高"的痛点。作为核心工具,平台中的 NN Compiler(神经网络编译器)集成 Parser(模型解析)、Optimizer(优化器)、GBuilder(生成器)及 AIPULLM(大模型运行工具),可实现主流模型的高效转化、自动化优化与部署配置生成,并具备以下核心能力:

  • **广泛的框架与模型支持:**支持超 160 种算子与 270 种模型,兼容 TensorFlow、ONNX、PyTorch、Hugging Face 等主流 AI 框架,提供开箱即用的 Model Zoo。

  • **创新的 Hugging Face 模型"一键部署":**通过 AIPULLM 工具链,直接支持 Hugging Face 格式模型,实现"一站式"转化与部署,极大降低开发门槛。

  • **先进的模型推理优化:**实现业界领先的大模型动态 shape 支持,高效处理任意长度输入序列;同时提供包括 Tensor/Channel/Token Level 多样量化方式,以及 GPTQ 等大模型主流量化方案,并增加对 LLM/VLM/VLA 及 MoE 等模型的高性能支持,保障推理精度并实现云到端快速迁移。

  • **灵活的开发者赋能:**提供多种开放接口,支持用户模型与自定义算子的开发与调试;配备丰富的调试工具与 Bit 精度软件仿真平台,支持多层次白盒开发与性能调优,极大简化算法移植与部署。

  • **全面的系统与异构兼容:**支持 Android、Linux、RTOS、QNX 等多种操作系统,并通过 TVM/ONNX 实现 SoC 异构计算,高效调度 CPU、GPU、NPU 等计算资源。

安谋科技 Arm China 积极构建开放生态,Compass AI 软件平台中的 Parser、Optimizer、Linux Driver、TVM 及内部 IR 格式等核心组件已相继开源,并拥有丰富的调试工具,可满足开发者白盒部署需求,且支持更易用的 DSL 算子编程语言。在此基础上,平台赋予开发者更深度的定制能力:客户不仅可以使用平台中的 Compiler、Debugger 或 DSL 语言开发出自己的自定义算子,也可通过 Parser、Optimizer 等工具打造出属于自己的模型编译器,从而实现差异化设计与开发效率提升。

"周易"NPU Compass AI 软件平台

不仅如此,安谋科技 Arm China 技术团队还围绕"周易"X3 NPU IP 和 Compass AI 软件平台的软硬件协同进行精心设计和反复论证,目标是提升客户最终落地方案的效率和能效。例如,在"周易"X3 NPU IP 的 AIFF 模块软硬件设计中,硬件端充分结合软件使用场景,通过增大总线带宽、增加 DMA(直接内存访问)的 outstanding(未处理的指令或数据请求)等方式提升数据搬运、数据并行效率,软件端则针对硬件特性设计专属使用模式,如对模型进行合理切分以充分发挥多核并行优势。

安谋科技 Arm China NPU 产品线负责人兼首席架构师舒浩博士

安谋科技 Arm China NPU 产品线负责人兼首席架构师舒浩博士认为:"'周易'X3 的产品优势,源于通用、灵活、高效且软硬协同的系统架构设计,这一设计使其兼具广泛的行业适用性与灵活的边端侧 AI 应用场景匹配能力。"

多场景落地

从无形 IP 到 AI 万象,端侧智能触手可及

新一代"周易"X3 NPU IP 将端侧智能的边界拓展至更广阔的应用场景,面向基础设施、智能汽车、移动终端、智能物联网四大领域,精准匹配当前爆发的端侧 AI 需求,可广泛应用于加速卡、智能座舱、ADAS、具身智能、AI PC、AI 手机、智能网关、智能 IPC 等 AI 设备:

  • **基础设施领域:**在加速卡场景中,"周易"X3 NPU IP 支持 CNN 与大模型等多样结构的 AI 模型高效加速,为数据中心及边缘计算节点提供核心算力。

  • 智能汽车领域:"周易"X3 NPU IP 同时赋能智能驾驶与智能座舱:在 ADAS 系统中,可为自动泊车等辅助驾驶功能提供高性能 AI 算力支持;在 IVI(车载信息娱乐系统)中,支持基于语音与车内外视频图像输入的智能互动。

  • **移动终端领域:**在 AI PC、AI 手机上,"周易"X3 NPU IP 可实现超分渲染,提升显示分辨率,并支持基于大模型的 AI Agent 应用,为用户带来更智能、更流畅的交互体验。

  • **智能物联网领域:**在智能网关、智能 IPC 等设备中,"周易"X3 NPU IP 支持本地 AI 推理,实现更快响应与更智能的终端体验,满足边缘设备对实时性与隐私保护的高要求。

"周易"NPU IP 系列家族现场 demo 展示区

此次发布会现场系统展示了"周易"NPU 产品家族的技术演进与落地成果,生动诠释其如何将无形的算力转化为触手可及的智能体验。

  • **"周易"Z1:**算力 0.32~3.75 TOPS,赋能 AIoT 场景,广泛支持人脸识别、人脸及人体关键点检测和文字识别等,且已进入 AI 智能音箱等多种产品。

  • **"周易"Z2/Z3:**算力 1.25~5 TOPS,面向 AIoT、入门级座舱等市场,支持前视辅助驾驶方案、舱泊一体方案及安全仪表盘方案,以及图像超分辨率优化等。

  • **"周易"X1:**算力 10 TOPS,面向高端 AIoT、汽车座舱等市场,支持驾驶员监控、乘客监控、自动泊车、AVM 360 环视,以及 AI 图像降噪等。

  • **"周易"X2:**算力 10-30 TOPS,面向高端 AIoT、AI PC、AI Pad、手机等市场,现场展示了运行 Stable Diffusion v1.5 的文生图能力,运行 CLIP 的文搜图能力,可实现端侧多模态 AI 流畅运行。

  • **"周易"X3:**算力 8-80 FP8 TFLOPS,面向基础设施、智能汽车、移动终端、AIoT 等市场,现场展示了基于"周易"X3 的主流大模型效果,包括运行 DeepSeek-R1-Distill-Qwen-1.5B 模型的文生文 AI 流畅对话,运行 Stable Diffusion v1.5 的文生图效果,运行 MiniCPM v2.6 模型的图片识别及图生文多模态应用等,均展现出优异的端侧大模型推理性能。

从"周易"Z1 的基础感知到"周易"X3 的复杂认知,这一技术演进路径清晰地表明,端侧 AI 正在从单一的功能实现,迈向融合多种模型、适应动态场景的"全民普及"新阶段。"周易"X3 NPU IP 的设计充分预判端侧 AI 的"场景深化"趋势:以极致算力表现破解"多模型融合"的算力需求,以全算力类型并增强浮点运算 FLOPS 适配"精度动态演变"的场景差异,借助软硬协同的生态打造端侧算力底座。

"周易"X3 NPU IP 新品发布会现场

"周易"X3 NPU IP 的发布,标志着安谋科技 Arm China"All in AI"产品战略的正式开启。安谋科技 Arm China 以"AI Arm CHINA"为战略发展方向,积极响应"AI+"行动计划,持续深耕技术领域创新,同时携手伙伴共建开放生态,加快构建国内"AI+"产业升级的智能计算基石,为千行百业智能化转型提供更强 IP"核芯"动力。

安谋科技 Arm China

安谋科技 Arm China 是国内领先的芯片 IP 设计与服务提供商。作为一家独立运营的合资企业,公司立足本土创新,坚持以自研业务技术创新与 Arm 技术授权相配合,为中国集成电路产业提供丰富的产品组合和解决方案,赋能中国智能计算"芯"生态。

相关推荐
网教盟人才服务平台1 小时前
“方班预备班盾立方人才培养计划”正式启动!
大数据·人工智能
芯智工坊1 小时前
第15章 Mosquitto生产环境部署实践
人工智能·mqtt·开源
菜菜艾1 小时前
基于llama.cpp部署私有大模型
linux·运维·服务器·人工智能·ai·云计算·ai编程
TDengine (老段)1 小时前
TDengine IDMP 可视化 —— 分享
大数据·数据库·人工智能·时序数据库·tdengine·涛思数据·时序数据
小真zzz1 小时前
搜极星:第三方多平台中立GEO洞察专家全面解析
人工智能·搜索引擎·seo·geo·中立·第三方平台
GreenTea2 小时前
从 Claw-Code 看 AI 驱动的大型项目开发:2 人 + 10 个自治 Agent 如何产出 48K 行 Rust 代码
前端·人工智能·后端
火山引擎开发者社区2 小时前
秒级创建实例,火山引擎 Milvus Serverless 让 AI Agent 开发更快更省
人工智能
冬奇Lab3 小时前
一天一个开源项目(第72篇):everything-claude-code - 最系统化的 Claude Code 增强框架
人工智能·开源·资讯
火山引擎开发者社区3 小时前
ArkClaw:以 SLI 度量驱动,构建新一代 Agent 全链路可观测体系
人工智能