为什么需要GPU？

图形处理器（GPU）是现代计算机系统中不可或缺的部分，它在许多应用中发挥了关键作用，特别是在3D图形渲染、深度学习和区块链等领域。

为什么我们需要GPU呢？

这源于它在图形渲染过程中的关键作用。让我们来看一下3D图形渲染的流程，它通常包括顶点处理、图元处理、栅格化、片段处理和像素操作五个步骤。

在这个流程中，绝大部分的处理都是固定的且可以并行的，不需要CPU的乱序执行、分支预测，以及实现他们的复杂电路。这使得GPU电路简单，算得更快，成本也可以更低。

早期的GPU图形渲染都是使用硬件的固定流水线处理的，要实现不同的渲染效果，开发人员只能调整配置参数。

2001年，微软在Direct3D 8.0中开始引入可编程管线的概念，使得开发人员可以修改顶点处理和片段处理的程序逻辑。

2005年，微软的XBox360提出了一种统一着色器架构，ATI和Nvidia也开始跟进采用。虽然流水线不同步骤的处理逻辑不同，但是可以使用相同的指令集，所以硬件电路可以共用。这使得着色器变成了一个通用模块，可以做各种通用计算。因此，图形处理器进化为通用图形处理器（GPGPU）。

2007年，NVIDIA发布了CUDA（Compute Unified Device Architecture）平台，这是一种使用NVIDIA的图形处理器进行通用计算的技术。CUDA平台提供了一个能让开发者直接使用高级语言编写GPU代码的接口，大大降低了开发难度。

随着CUDA的出现，GPU开始被广泛用于机器学习领域。机器学习算法，尤其是深度学习算法，通常涉及大量的矩阵运算，这种计算特性非常适合GPU的并行处理能力。例如，神经网络的训练过程中，需要对大量的神经元进行并行计算，这正是GPU擅长的。

此后，许多基于CUDA的深度学习框架，如TensorFlow、PyTorch等，开始出现。这些框架进一步降低了使用GPU进行深度学习的门槛，使得更多的研究者和开发者能够利用GPU进行机器学习。

现代GPU有以下特点：