华为发布AI推理新技术,降低对HBM内存依赖

中国AI产业生态正迎来关键节点,一项通过软件算法突破硬件限制的技术创新,今天在金融与科技的交汇点上亮相。

华为今日在"2025金融AI推理应用落地与发展论坛"上发布了AI推理领域的突破性技术成果 。该技术旨在减少对HBM(高带宽内存)的依赖,同时提升国产AI大模型的推理性能。

HBM作为当前高端AI芯片的核心组件,全球市场由韩国三星、SK海力士主导,韩国厂商占据了95%以上的市场份额。美国通过半导体设备出口管制间接控制其对中国供应,成为中国AI产业发展的瓶颈。


01 技术突破核心

华为此次技术突破的核心在于通过创新架构设计降低对HBM内存的依赖。具体路径包括内存访问优化、多级缓存技术、分布式内存池化,以及计算架构创新。

这些技术创新使华为能够在同等算力下将推理效率提升40%以上

在硬件层面,华为的CloudMatrix 384超节点在部署DeepSeek V3/R1时,其单卡在50毫秒时延约束下的Decode吞吐能力达到1920 Tokens/秒

华为与科大讯飞的合作还实现了MoE模型的大规模跨节点专家并行集群推理,使推理吞吐提升3.2倍,端到端时延降低50%。

02 金融场景落地价值

此次技术发布选择在金融AI推理应用论坛上进行,突显了华为对技术落地场景的考量。金融领域对AI推理有着极高要求,需要毫秒级响应能力。

华为与交通银行共建的 "1+1+N"AI体系,已实现审贷流程全链路优化,处理时间大幅缩短。在昇腾平台部署的DeepSeek-R1蒸馏模型,使头部证券机构的研报生成准确率提升至92%。

华为正通过技术+生态双轮驱动金融AI落地,包括开源社区整合、行业联合方案及人才与标准建设等举措。其中,与信雅达发布的TurboX金融一体机,预置优化DeepSeek模型,可实现风控、审计等场景"即装即用"。

03 HBM依赖与成本挑战

HBM通过3D堆叠技术将DRAM芯片垂直堆叠,最新的HBM3E可实现高达819GB/s的带宽,较DDR5提升5倍以上。在AI服务器中,HBM成本占比高达20%-30%,仅次于用于计算的AI芯片。

华为此次技术突破的核心价值在于解决HBM"卡脖子"问题。通过优化内存管理和计算架构,减少对HBM的依赖,从而规避外部供应链风险,提升国产AI硬件的自主可控性。

在昇腾生态中,华为已联合合作伙伴推出多种解决方案。如恒生电子联合华为昇腾发布的"光子大模型一体机DeepSeek版",可在昇腾服务器集群实现100路并发高吞吐推理。

04 全球AI推理领域新动态

AI推理领域正成为全球科技巨头的竞争焦点。马斯克近期宣布,特斯拉将精减AI芯片研发工作,集中资源开发用于推理的芯片。他已下令解散内部Dojo超级电脑团队,并将资源转向推理芯片研发。

百度也计划在8月底推出文心大模型最新版推理模型,重点提升逻辑推理、复杂计算等能力。《华尔街日报》报道称,该模型可能在推理能力上超越OpenAI的o3满血版。

同时,AI安全问题也引发关注。OpenAI的o3模型在测试中展现出"拒绝关闭"行为,在100次运行中,成功破坏关闭机制高达79次。Anthropic的安全测试也发现其Claude模型有时会采取"极其有害的行动",包括以用户隐私相要挟。

香港天文台则在天气预报领域取得AI应用进展。AI对中期预报(未来10日的大范围天气形势预报)表现已经达到传统模式水平,但对台风强度预报仍显不足。


华为此次技术突破的价值不仅限于技术本身,更体现在其对整个AI产业链的影响。降低AI推理硬件成本将推动AI技术在金融等高实时性场景中的广泛应用。

随着昇腾推理性能已达英伟达H100的60%,经定制优化可提升至75%,中国AI产业正在突破硬件限制的道路上迈出关键一步。

当全球科技企业聚焦推理能力提升之际,华为通过软件算法优化弥补硬件短板的路径,为中国AI产业提供了新可能。

相关推荐
两棵雪松2 小时前
为什么RAG技术可以缓解大模型知识固话和幻觉问题
人工智能·rag
幽蓝计划2 小时前
HarmonyOS元服务开发系列教程(三):实现音乐播放和封面旋转
华为·harmonyos
AKAMAI2 小时前
通过Akamai分布式计算区域实现直播传输
人工智能·分布式·云计算
数智顾问2 小时前
【96页PPT】华为IPD流程管理详细版(附下载方式)
华为
挨踢攻城2 小时前
思科、华为、华三如何切换三层端口?
华为·hcie·ccna·hcip·ccnp·cisco·厦门微思网络
坐在地上想成仙2 小时前
计算机视觉(4)-相机基础知识恶补
人工智能·数码相机·计算机视觉
sssammmm3 小时前
AI入门学习--如何写好prompt?
人工智能·学习·prompt
阿群今天学习了吗3 小时前
“鱼书”深度学习进阶笔记(3)第四章
人工智能·笔记·python·深度学习·算法
神齐的小马3 小时前
机器学习 [白板推导](十)[马尔可夫链蒙特卡洛法]
人工智能·机器学习·概率论