【新智元导读】巨头英伟达,即将收购阿里前副总裁贾扬清的初创 Lepton AI,交易价值或达数亿美元!而 Lepton AI,仅仅创立两年。
就在刚刚,国内 AI 圈被这一消息刷屏了。
贾扬清成立两年的 AI 初创公司 Lepton AI,即将被英伟达收购。
据外媒 The Information 报道,英伟达正在接近达成收购 Lepton AI 的协议,交易金额为数亿美元。
而 Lepton AI 的主要业务,就是专门出租由英伟达 AI 芯片驱动的服务器。
根据贾扬清介绍,在 SemiAnalysis 评选的 neolcould 解决方案中,Lepton AI 是唯一一个没有重金采购 GPU 的公司。
因为他们采用的是云原生的多云解决方案,能让任何一家 GPU 提供商迅速升级。
为什么英伟达选择在此时重金收购 Lepton AI?
原因是,亚马逊和谷歌这些老客户步步紧逼,英伟达被逼得实在没有办法了,不得不立刻转型!
老客户背刺,英伟达被迫转型
本来,亚马逊和谷歌都是英伟达的最大客户,但现在,它们纷纷通过开发、低价租赁替代芯片,来降低对英伟达的依赖。
这样导致的结果,就是英伟达的收入大幅减少。
而收购 Lepton AI,是英伟达进军云计算和企业软件市场战略布局的一部分,目的就是为了和亚马逊、谷歌开战。
Lepton AI 的总部位于加州,在租赁英伟达 GPU 服务器业务上,它和 Together AI 之类的初创公司是直接竞品。
注意,这些公司并不会自行管理数据中心或服务器,而是先从云服务提供商租用服务器,再租给自己的客户。
这个业务,利润空间就很大了。
据悉,Together AI 如今已经实现了超过 1.5 亿美元的年化收入,换算一下,就是大概 1250 万美元的月收入。
这类企业,在业内被称为「推理服务提供商」或「GPU 转售商」。
另外,他们的业务除了硬件租赁,还包括开发自己的软件平台,帮助其他初创公司或软件企业这类客户在云环境中构建和管理自己的生成式 AI 应用。
不过跟 Together 相比,Lepton AI 的收入规模就没有那么大了。
他们 AI 云服务的主要客户,有游戏初创公司 Latitude.io 和科研初创公司 SciSpace。前者使用使用 Lepton AI 来运行 AI 模型,支持一项月活用户已达数十万的服务。后者使用 Lepton AI 为学术论文搜索引擎提供技术支持。
总之外媒称,跟 Together、Firewoks 这些竞争对手相比,Lepton AI 在市场上的形象总体比较低调。
被英伟达高价收购的 Letpon AI,是何背景?
2023 年 7 月,贾扬清离职阿里 4 个月后,新公司 Letpon AI 正式浮出水面。
这是一家专注于人工智能基础设施的公司,总部位于美国加利福尼亚州 Palo Alto。Lepton AI 这个名称源自物理学中的一种基本粒子------轻子。
公司曾于 23 年 5 月成立之前,完成了首轮 1100 万美元天使融资,由红杉中国、Fusion Fund、CRV 等投资。
当时,贾扬清在回复 Pytorch 之父评论中,曾提到还有两位联创与其一起创办了新公司,分别是 ONNX 创始人以及 etcd 的创始人。
此前,贾扬清最初在谷歌大脑担任研究科学家,还参与构建了部分支持 Kubernetes 的软件,Kubernetes 是一个起源于谷歌的大规模云应用程序管理工具。
2016 年,他加入 Meta 担任 AI 研究员后,又与白俊杰一起参与了 PyTorch 的开发。
Letpon AI 的核心定位是,成为「AI 时代云服务提供商」,旨在建立高效的 AI 应用平台。
其主要业务通过提供大模型推理引擎和云 GPU 解决方案,帮助企业去快速部署 AI 应用。而且,他们还建立了多云平台,整合全球 GPU 资源,让用户获得极具性价最高计算资源。
而且,团队还开发了一款智能搜索引擎 Lepton Search,仅用 500 行 Python 代码构建,以轻量级、高效著称。
|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| |
|
英伟达之困:光靠卖 GPU,已经不够了
为什么英伟达要收购 Lepton AI?显然,这是计划的一部分。
英伟达,如今显而易见正在构建全新的业务版图。
虽然它的云计算和软件业务目前尚处于起步阶段,但它已经开始向企业出租由自家芯片驱动的服务器,同时还会提供软件,帮企业开发 AI 模型和应用,以及管理用于训练 AI 的 GPU 集群。
根据英伟达的估计,这些业务未来有望创造高达 1500 亿美元的收入。
GTC 大会上,老黄宣布:英伟达正在构建 3 个 AI 基础设施------云上 AI 基础设施,企业 AI 基础设施和机器人 AI 基础设施
不过有些微妙的是,在本月中最近一次季度财报电话会议上,英伟达却完全回避了这一话题。
三个月前,英伟达靠软件、服务和支持业务,已经实现了 15 亿美元的年化收入(每月约 1.25 亿美元),而英伟达预计,这一数字将在 2024 年底前攀升至 20 亿美元。
而英伟达的芯片业务,在截至 1 月 26 日的财季中创造的收入为 356 亿美元。
总之,虽然 AI 芯片仍然是英伟达的核心收入来源,但显然,软件、服务和支持业务的增长潜力巨大,英伟达已经下定决心,瓜分这一块蛋糕。
英伟达 2025 财年第四季度财报显示,公司发展一片大好,市场对 AI 芯片的需求依旧强劲
英伟达,大力发展工业客户
符合这一步调的是,英伟达最近几个月一直在大力宣传自家的软件产品。
虽然过去几年中,英伟达大概一半的 AI 服务器芯片,都是被云服务提供商买走了,不过老黄表示------
长期来看,英伟达对其他类型企业的销售额占比,将远远大于对云服务提供商的销售额。
他还暗示道,包括汽车制造商在内的工业企业,未来会直接购买 AI 芯片,而不是从云服务商那里租用。
此前大家对 AI 芯片的批评,主要就集中在价格昂贵、需求旺盛,让企业想扩展 AI 应用规模时,面临成本上的巨大压力。
但最近,DeepSeek 这种价格亲民的强大模型,已经让局面彻底改变了。
而这几年,英伟达也在一刻不停地收购小型生成式 AI 和云计算初创公司,为的就是降低成本,让开发者能轻松使用英伟达芯片。
过去一年,英伟达就斥巨资收购了 Run.ai 和 Deci,代价或许超过 10 亿美元。而最近收购的则是 OctoAI 和 Gretel。
英伟达一直在收购小型生成式 AI 和云计算初创公司,以降低成本并使开发者更容易使用其芯片运行 AI 模型
GPU 云服务评级,贾扬清初创进第二梯队
SemiAnalysis 最新文章中,发布了世界上首个 GPU 云服务评级系统 ClusterMAX™。
这个系统主要以普通用户的角度对 GPU 进行评,共分为 5 个不同等级:白金、黄金、白银、青铜和不及格。
目前,他们已独立测试了数十种 GPU。
白金代表着引领行业标准的 GPU 云服务,目前也仅有一家 CoreWeave 达到这一级别。而在超大规模云服务提供商中,Oracle 的 GPU 租赁价格是最低的之一。
评测结果还显示,一些青铜提供商,已经在努力赶上如谷歌云。谷歌云也在快速发展,有望下次冲进黄金 / 白金。
值得一提的是,Lepton AI 这家仅成立 2 年的公司,成功进入第二梯队(黄金)。
Lepton AI,具体是干什么的
Lepton AI 本身不拥有 GPU 硬件,而是专注于提供一个 ML 平台软件层,用于管理和优化 GPU 资源。
不论是初创公司,还是个人开发者, Lepton AI 宣称皆能赋予专业级算力支持。
他们提供了两种灵活的使用方式,具体来说:
· 租用 GPU:Lepton AI 会从其他供应商租用 GPU,在叠加上自家软件层,每 GPU 小时仅需额外支付几分钱。
· 自选 GPU:从价格更优的 Nebius 租用 GPU,然后单独购买 Lepton AI 软件和服务,同样是每 GPU 小时几分钱,即可享受完整的平台功能。
他们将谷歌、Meta 等科技巨头在机器学习平台上的经验「平民化」,让普通用户也能轻松上手。
这种灵活性,能够让用户根据预算和需求自行选择。Lepton AI 工程团队凭借着敏锐的产品洞察力,确保了平台高效性。
针对训练,他们提供了一种类似 Slurm 的作业提交方法。
在 SemiAnalysis 测试中,将现有的 sbatch 脚本正常运行在 Lepton AI 平台上,仅需几分钟的时间。而且,转换到平台进行训练的过程相当直观。
不过,Lepton AI 提供的类似于 Slurm sbatch 功能,而非完整的 sbatch 超集 API。
此外,Lepton AI 的控制台仪表板,是其一大亮点。
用户可以轻松查看节点生命周期,实时监控每个节点当前的作业和状态,可视化功能仅次于 CoreWeave 的节点生命周期仪表板。
并且,Lepton AI 推出的开源解决方案 gpud,已经为大多数被动健康检查项目提供了全面的支持。
虽然这个被动 GPU 检查系统仍在持续优化中,但已经算是非常强大的解决方案。
此外,Lepton AI 也会提供手动主动健康检查功能,比如 DCGM 诊断和 nccl-tests,但这些检查需要通过 UI 仪表板手动运行,不像 CoreWeave 那样能够自动按周进行定期检查。
还不足的是,Lepton AI 没有提供 NCCL 测试的参考数值,也缺少 Megatron Loss 收敛主动健康检查或 Nvidia TinyMeg2 静默数据损坏 (SDC) 检测器主动健康检查。
另外,Lepton AI 还提供了一些测试版功能,比如一键式零影响 NCCL 分析器。
只需点击一个复选框,就能充分利用其自主研发的内部 NCCL 分析器来可视化集体通信瓶颈,这样就能帮助客户优化网络性能瓶颈。
贾扬清:Caffe 之父,AI 框架缔造者
提到贾扬清,可以说是业内耳熟能详的「框架大神」。
作为主流 AI 框架 Caffe 创始人、TensorFlow 的作者之一,PyTorch 1.0 的共同缔造者,他的贡献早已深入 AI 开发的每个角落。
贾扬清,浙江绍兴人,本科和研究生阶段都就读于清华大学自动化专业。
在研究生学习期间,他曾在新加坡国立大学、微软亚洲研究院、NEC 美国实验室和谷歌研究院工作 / 实习,积累了丰富的实践经验。
2008 年,他赴往加州大学伯克利分校攻读计算机科学博士,导师是 Trevor Darrell 教授。
在博士期间,他创立并开源的深度学习框架 Caffe。这个框架一经推出,因其高效性、易用性迅速走红,被微软、雅虎、英伟达、Adobe 等公司采用。
毕业后,2013 年,贾扬清正式加入谷歌大脑团队,在 Hinton 和 Jeff Dean 等人的带领下,参与了 TensorFlow 平台的开发 。
此外,他还与同事一起建立了全新深度学习架构 GoogLeNet------首个在图像分类任务中,超越人类准确性的神经网络。
3 年后,贾扬清转投 Facebook(Meta),在 Yann LeCun 领导下担任研究科学家,并在 2017 年,晋升为 AI 架构总监。
在此期间,贾扬清在 AI 架构的大道上一路进击:
· 2016 年 11 月,Facebook 推出轻量级模块化的深度学习框架 Caffe2Go,让手机也能运行深度神经网络模型。
· 2017 年 4 月,Facebook 宣布开源产品级深度学习框架 Caffe2,带来跨平台机器学习工具。
· 2017 年,创建了首个开放模型格式 ONNX 原型,后来被 FB、微软、亚马逊等公司联合推广。2018 年 5 月,Facebook 正式公布的 PyTorch 1.0 整合了 ONNX 格式。
2019 年 3 月 18 日,贾扬清加入阿里达摩院,担任技术副总,负责大数据以及 AI 方向的技术、产品和业务。
直到 2023 年 3 月,他官宣离职,并在几个月之后创办了 Lepton AI。
根据个人主页,贾扬清被引数最高的三篇论文,TensorFlow 和 Caffe 赫然在列,他的每一步都推动了深度学习工具普及与进化。
曾有网友戏称,学物理绕不开牛顿,搞深度学习,绕不开贾扬清。
参考资料: