1999年,NVIDIA推出全球首款GPU------GeForce 256,其初衷仅是让电脑游戏中的3D画面更加逼真。然而,当时无人能料想,这颗为"图形渲染"而生的芯片,竟会蜕变为点燃人工智能革命的超级引擎......
1、图形渲染
1.1 什么是图形渲染
当你在电影院观看某电影,被某个宏大逼真的光影特效震撼时,这个就是图形渲染(Rendering)。
图形渲染:就是把三维世界,变成你屏幕上看到的二维图像。
图形渲染的核心逻辑是:
(1)世界由 点、线、三角形 构成
(2)屏幕由 像素 构成
(3)渲染的任务就是:计算每个像素该显示什么颜色
为了让屏幕上的3D模型拥有真实感,计算机需要精确模拟每一束光线的传播、反射与折射,并计算出屏幕上数以百万计像素点的颜色。
1.2 图形渲染的特点
任务量大、逻辑简单、高度重复、互不干扰 。
一张高清屏幕包含数百万个 像素点,每一帧画面都需要对所有像素点逐一完成坐标转换、光影计算、纹理填充、色彩校正等基础运算。
这些运算没有复杂的逻辑判断 ,不需要前后任务关联,每一个像素的计算都是独立 、同质化的简单数学操作,且需要在瞬间完成上亿次运算,才能保证画面流畅不卡顿。
从1080P的200万像素,到2K的369万像素,再到4K的830万像素,屏幕分辨率的每一次跃升,都意味着需要实时计算并渲染出成倍增加的像素点
1.3 CPU不合适渲染
(1)CPU定位是通用全能处理器,主打逻辑运算
(2)核心少,几核、十几核,不擅长"海量批量并行"
2、GPU登场
为了打破图形渲染的僵局,GPU(图形处理器)应运而生。
1999年,NVIDIA推出了世界上第一款真正意义上的GPU------GeForce 256,它首次将繁重的图形计算从CPU中剥离出来。
GPU的设计哲学是极致的"大规模并行处理 ",内部集成了几百、数千、上万个相对简单的计算核心,它们虽然无法处理复杂的逻辑跳转,但天生擅长执行大量、重复且彼此独立的数学运算。
在图形渲染中,GPU可以将海量的像素计算任务瞬间分配给这些核心。大家同步开工、分头计算,从而在几毫秒内完成CPU需要数小时才能搞定的渲染工作。这种依靠数量取胜的"人海战术",让GPU在游戏和影视领域大杀四方,也为其日后的跨界逆袭积累了强大的硬件基因。
3、闯进 AI 世界
2006年,英伟达正式推出 CUDA 统一计算设备架构,彻底改写了 GPU 的使用边界。GPU 从此可以承接各类通用计算任务,从专用图形硬件,蜕变为一台灵活高效的并行超级计算机。
深度学习模型(神经网络)的训练和推理,本质上就是海量数据的"矩阵乘法"和"张量计算"。矩阵乘法的特点:
(1)数据量巨大
(2)计算重复
(3)高度并行
这正是 GPU 最擅长的。
2012 年,AlexNet 用 两块 NVIDIA GTX 580 训练 ,把图像识别准确率大幅提升,在 ImageNet 上准确率暴打传统方法,震惊整个计算机视觉界。
当深度学习技术迎来爆发,对海量并行算力的需求井喷式增长,业界才猛然意识到,CUDA 生态下的GPU,早已是适配 AI 训练的理想载体。CUDA 架构,给 GPU 打开了 "通用计算" 的大门: 开发者可以直接调用 GPU 的成千上万个计算核心,专门做 AI 训练、科学模拟、密码运算等 "纯算数" 任务。
如今,GPU 彻底坐稳 AI 技术栈的 C 位,从训练到推理,全链条掌控 AI 算力命脉。