极智AI | 谈谈AI发展第三篇:AI训练算力

欢迎关注我的公众号 [极智视界],获取我的更多经验分享

大家好,我是极智视界,本文来谈谈 AI训练算力,是谈谈AI发展系列的第三篇。

邀您加入我的知识星球「极智视界」,星球内有超多好玩的项目实战源码下载,链接:t.zsxq.com/0aiNxERDq

在去年六月份 (没错,是去年了),我开了一个系列 "谈谈 AI 发展",里面规划是包含五篇内容:

  • 谈谈 AI 发展第一篇:AI 训练框架 ==> 访问方式:链接
  • 谈谈 AI 发展第二篇:AI 推理框架 ==> 访问方式:链接
  • 谈谈 AI 发展第三篇:AI 训练算力 ==> 鸽了很久的本篇;
  • 谈谈 AI 发展第四篇:AI 推理算力 ==> 敬请期待;
  • 谈谈 AI 发展第五篇:AI 编译框架 ==> 敬请期待;

第三篇确实鸽了很久,可能由于我本身背景更偏向于算法落地,所以对于算法训练的执笔会相对谨慎 (这个意思也可以理解为:我对下一篇 AI 推理算力是会顺手一些的,hhhh ~)。最近,时不时地看到知乎上对于前两篇文章的动态,翻看一下发现收藏和喜欢的朋友挺多,偶尔也收到了一些留言希望续写,所以很自然是需要续上的。

时光斗转星移,AI 飞速发展。

满打满算,我真正进入到 AI 这个行业差不多五年多的样子,这段时间其实是正处于 AI 框架和 AI 算法本身快速发展的黄金阶段。也很有幸见证了一些 "古早" 的框架、算法,以及从 "古早" 到 "现代" 快速进化的过程,感慨良多。我决定在这几篇文章中谈谈我这个阶段对于 AI 的一些基础设施,如框架、算力、算法等的思考、感受和想法,作为一种输出,也作为一种记录,可能几年后回过头再来看,会别有一番滋味。

AI 训练算力是第一篇 "AI 训练框架" 的底座,很明显就是拿来做算法训练的算力设备。第一时间想到的当然会是英伟达的卡,记得 18 年我还在实习的时候,组里大家就只有一张卡 Titan X,是不是有点年代感了,那时候训练是要 "排班" 的,再说个还显年代感的:当时是拿着 Titan X 训练 Caffe (你就说,那帮现在做的 Pipeline 里优先支持 caffemodel 的人,是不是跟我一个年代的)。

不管是训练算力还是推理算力,英伟达始终是那个 "大山" 一样的存在,所以自然需要先来说英伟达的训练算力。要说英伟达的训练算力,首先需要介绍英伟达的几个产品线,主要如下,

  • GeForce 产品线 -> 面向游戏玩家和普通消费者,包括大家熟悉的 RTX40 系列、RTX30 系列、RTX20 系列等;
  • Quadro 产品线 -> 面向专业图形设计、视频剪辑等应用场景;
  • Tesla 产品线 -> 面向高性能计算和机器学习任务的产品线,比如常见的 Tesla L4、Tesla A100 等;
  • Tegra 产品线 -> 英伟达的移动处理器产品线,用于智能手机、平板电脑、汽车电子等领域;
  • Jetson 产品线 -> 面向边缘计算和人工智能应用的嵌入式开发平台,也就是常说的边缘计算盒子,比如 Jetson Xavier NX、Jetson Xavier Orin 等;
  • Drive 产品线 -> 面向自动驾驶技术,包括从云端到车端的全流程;
  • DGX 产品线 -> 做服务器的;

拿板级训练算力来说,主要指的就是 GeForce 和 Tesla 系列,可以看到身边很常见的训练服务器,比如 RTX 2080 服务器、RTX 3090 服务器、V100 服务器、A100 服务器都属于英伟达这两个产品线,其实你也会发现所谓的 "游戏卡" 和 "训练卡" 往往会 "傻傻分不清",主要指的就是 GeForce 系列。这个系列如 RTX 3090,有人拿来打游戏,有人拿来训练模型。而 Tesla 系列,基本就是标准的 GPGPU 了,就是专门用来做高性能计算的。另外值得一提的是 RTX4090D,这款龙年特供卡基本就是被禁的 4090 的 "阉割版",我去查了下现在京东上已经开始 4090D 的预购预约了。这款卡也许是很多游戏人的福音,但在算法训练领域,同样是个很好的选择。

下面从时间线上来进行分析,分为古代近代现代未来展开,当然下面的 GPU 架构只是一个参考,并不具备直接的串行递进关系,

  • 古代 -> P100、Titan X、2070、2080 等;
  • 近代 -> V100、3080、3090 等;
  • 现代 -> A100、A800、H100、H800、4090 等;
  • 未来 -> B100 等;

这么来看,似乎很多的普通 AI 企业的算力还是停留在 "古代" - "近代","现代" 的卡是存货是土豪都买不到的,而 "未来" 也只能想想。

再来看咱们的国产训练卡,这里主要提两款,一个是华为昇腾 Ascend 910b,一个是天数天垓100 BI-V100 (以及新一代天垓150)。先说天数的,前几天有个读者问我:国产训练卡有啥推荐的 (除了昇腾外),当时我刚看完 "2023 人工智能计算大会" 智源研究院林咏华老师分享,随之很自然的脱口而出:可以看看天数的。看下面两张图吧,我知道的是天垓 BI-V100 是对标 NVIDIA V100 的,至于 BI-V150 是什么级别,这个目前我还不太清楚。

来说昇腾 Ascend 910b,对于昇腾 910b 处于什么样的水平,23 年科大讯飞三季度业绩说明会上已经给昇腾 910b 定了一个 "基调":"昇腾 910b 芯片的性能已经达到了英伟达 A100 芯片的水平,甚至在某些方面还有所超越 "。所以现在很多提到昇腾 910b,都会拿 "可直接对标 A100 " 来形容。虽然我没用过昇腾 910b,但是从它的算力性能数据来看,确实是挺强的。另外更加重要的是昇腾的 "基建能力" 特别强,超算中心已经有好几个,杭州范围内就有滨江超算中心和宁波超算中心,下面是前段时间参加昇腾开发者大会的图。"杭勇双算 智惠浙里,日昇月恒 奔腾不息",不得不说,华为是懂 "对联" 的。

另外还有朋友可能会说,是不是忘了天河、忘了神威太湖之光等等,当然没忘,只是这些主要是用于科学计算而非 AI 计算。

好了,以上分享了 谈谈 AI 发展第三篇:AI 训练算力,希望我的分享能对你的学习有一点帮助。


【公众号传送】

《极智AI | 谈谈AI发展第三篇:AI训练算力》

畅享人工智能的科技魅力,让好玩的AI项目不难玩。邀请您加入我的知识星球, 星球内我精心整备了大量好玩的AI项目,皆以工程源码形式开放使用,涵盖人脸、检测、分割、多模态、AIGC、自动驾驶、工业等。一定会对你学习有所帮助,也一定非常好玩,并持续更新更加有趣的项目。 t.zsxq.com/0aiNxERDq

相关推荐
Trouvaille ~3 分钟前
【机器学习】从流动到恒常,无穷中归一:积分的数学诗意
人工智能·python·机器学习·ai·数据分析·matplotlib·微积分
dundunmm11 分钟前
论文阅读:Deep Fusion Clustering Network With Reliable Structure Preservation
论文阅读·人工智能·数据挖掘·聚类·深度聚类·图聚类
szxinmai主板定制专家20 分钟前
【国产NI替代】基于FPGA的4通道电压 250M采样终端边缘计算采集板卡,主控支持龙芯/飞腾
人工智能·边缘计算
是十一月末20 分钟前
Opencv实现图像的腐蚀、膨胀及开、闭运算
人工智能·python·opencv·计算机视觉
云空27 分钟前
《探索PyTorch计算机视觉:原理、应用与实践》
人工智能·pytorch·python·深度学习·计算机视觉
杭杭爸爸29 分钟前
无人直播源码
人工智能·语音识别
Ainnle2 小时前
微软 CEO 萨提亚・纳德拉:回顾过去十年,展望 AI 时代的战略布局
人工智能·microsoft
长风清留扬2 小时前
基于OpenAI Whisper AI模型自动生成视频字幕:全面解析与实战指南
人工智能·神经网络·opencv·计算机视觉·自然语言处理·数据挖掘·whisper
灰太狼不爱写代码3 小时前
CUDA11.4版本的Pytorch下载
人工智能·pytorch·笔记·python·学习
volcanical6 小时前
Dataset Distillation with Attention Labels for Fine-tuning BERT
人工智能·深度学习·bert