超越CUDA围墙:国产GPU在架构、工艺与软件栈的“三维替代”挑战

十年前,如果有人问起"谁能造出最好的GPU",答案几乎毫无悬念------英伟达与AMD,两家美国巨头牢牢把持着全球GPU市场的王座。彼时的中国,在被誉为"AI算力心脏"的GPU领域,还是一片亟待开垦的荒原,高端GPU更像是技术金字塔尖遥不可及的符号。

转折发生在2018年。美国步步紧逼的技术封锁与席卷全球的AI浪潮狭路相逢,高性能GPU一夜之间从科技产品变成了国内企业争相抢购的"战略物资"。戏剧性的是,在出口限制的收紧下,英伟达在中国数据中心市场的份额一度从超过95%暴跌至近乎归零。

正是这场被外部压力"逼"出来的产业进击,拉开了国产GPU自主化的序幕。 几乎在同一时期,摩尔线程、沐曦股份、壁仞科技、燧原科技等一批国产GPU企业相继成立,目标直指通用GPU,决心在国际巨头的主赛道上开启竞速狂飙。

2024年底至2025年初,这场征程迎来了标志性的资本市场里程碑:

  • 12月5日,"国产GPU第一股"摩尔线程登陆科创板,首日股价盘中飙升超500%。
  • 12月17日,沐曦股份在科创板挂牌,盘中最高涨幅超过700%,成为A股全面注册制以来最赚钱新股。
  • 紧随其后,壁仞科技与天数智芯相继通过港交所聆讯,竞逐"港股国产GPU第一股"的称号。
  • 而燧原科技也已进入上市辅导阶段,目标直指科创板。

一边是国际巨头在附加条件下"回归"中国市场,一边是本土领军企业在资本市场高歌猛进。至此,国产通用GPU的"四小龙"第一梯队正式成形------摩尔线程、沐曦股份、壁仞科技、天数智芯。它们正以差异化的战略路径,共同向英伟达筑起的生态高墙发起冲击。产品定位与核心场景:两条路径,分进合击

国产GPU"四小龙"虽同处一赛道,却选择了截然不同的突围路径,其中沐曦股份、壁仞科技与天数智芯在产品定位与市场策略上形成了鲜明对比。

沐曦股份:国产替代的"稳定之锚"

定位: 训推一体全能型选手,主打"国产合规+CUDA生态兼容"。

核心产品: 曦云C系列(训推一体)、曦思N系列(推理专用)。

核心场景:

政企与垂直行业市场:深度绑定国家智算中心、中科院、金融机构等"国家队"客户,强调产品的国产合规性、稳定性和供应链安全。

科学计算: 凭借对双精度(FP64)计算的原生支持,在气象预测、生物医药等科研领域构建优势。

关键策略: 采用中芯国际12nm工艺,构建从设计、制造到封测的全链路国产化供应链,在当下地缘政治环境中具备显著的抗风险能力和准入优势。

壁仞科技:性能突破的"尖刀部队"

定位: 极致性能突破型选手,专攻"算力天花板"需求。

核心产品: BR100系列高端通用GPU,壁砺™系列。

核心场景:

大专注人工智能与科学计算场景的通用GPU研发,其核心产品包括壁砺™系列算力芯片、海玄服务器及BIRENSUPA软件开发平台,主要服务于大型数据中心。

千亿参数大模型训练: 已成功落地于阿里Qwen、DeepSeek等头部大模型的训练,擅长千卡级大规模集群部署。

关键策略: 采用台积电7nm先进制程与Chiplet(芯粒)技术,追求极限算力密度和高速互连性能,在纯粹的计算性能上挑战国际领先水平。

天数智芯:量产先行的"开路先锋"

定位: 历史最久、量产最早的全产品线覆盖者。

核心场景: 拥有"天垓"(训练)和"智铠"(推理)两条完整产品线,是国内少数能同时提供训练和推理通用GPU的厂商。其产品已应用于金融服务、医疗保健、工业数字化转型等多个领域。

关键里程碑: 首家实现推理及训练通用GPU芯片量产的中国芯片设计公司,并首家采用7nm工艺达成该里程碑。截至2025年6月,累计交付GPU超5.2万片,服务客户超290名。

简单来说,用户若优先考虑国产合规、生态平滑迁移与供应链安全,沐曦是更稳妥的选择;若追求极致算力以应对最前沿的大模型训练,壁仞则展现了更强的锋芒。 而摩尔线程,作为唯一的"全功能型"选手,则覆盖了从AI计算、图形渲染到消费级市场的更广阔战线。

总结

一边是国际巨头在特定条件下重返中国市场,另一边是以"四小龙"为代表的国产GPU企业,正通过差异化的技术路径和市场策略,在自主可控、极致性能、全功能覆盖和早期量产等多个维度上全面进击。从十年前的一片荒芜,到如今第一梯队的集结与资本市场的认可,国产GPU产业在外压内驱下,已驶入了自主发展的快车道,正共同向由国际巨头长期主导的GPU生态高墙发起前所未有的冲击。未来,这场围绕"AI算力心脏"的竞争,必将更加激烈,也更加值得期待。

相关推荐
TechNomad2 小时前
排序算法:快速排序算法
算法·排序算法
xu_yule2 小时前
算法基础(图论)—拓扑排序
c++·算法·动态规划·图论·拓扑排序·aov网
bryant_meng2 小时前
【GA-Net】《GA-Net: Guided Aggregation Net for End-to-end Stereo Matching》
人工智能·深度学习·计算机视觉·立体匹配·ganet
mu_guang_2 小时前
算法图解1-算法简介
算法·cpu·计算机体系结构
不穿格子的程序员2 小时前
从零开始写算法——二叉树篇2:二叉树的最大深度 + 翻转二叉树
算法·二叉树·深度优先
小O的算法实验室2 小时前
2024年IEEE TAES SCI2区,一种改进人工电场算法用于机器人路径规划,深度解析+性能实测
算法·论文复现·智能算法·智能算法改进
十铭忘2 小时前
SAM2跟踪的理解13——mask decoder
人工智能·深度学习
gugugu.2 小时前
算法:N皇后问题
算法
rayufo2 小时前
arXiv论文《Content-Aware Transformer for All-in-one Image Restoration》解读与代码实现
人工智能·深度学习·transformer