PyTorch：深度学习研究的核心引擎（上）

xqlily2025-12-08 9:16

张量计算与自动微分

PyTorch 提供 torch.Tensor 作为核心数据结构，支持 GPU 加速的数值计算。通过 torch.autograd 模块，框架可自动追踪张量操作并计算梯度，例如：
python 复制代码
```
x = torch.tensor([1.0], requires_grad=True)
y = x**2 + 3*x
y.backward()  # 自动计算梯度 dy/dx
```
此时 x.grad 将存储梯度值 $\\frac{dy}{dx} = 2x + 3$ 。
模块化神经网络构建
torch.nn 模块提供预定义层（如卷积层、LSTM）和损失函数，用户可通过继承 nn.Module 自定义网络结构：
python 复制代码
```
class CNN(nn.Module):
    def __init__(self):
        super().__init__()
        self.conv = nn.Conv2d(3, 16, kernel_size=3)
        
    def forward(self, x):
        return self.conv(x)
```
这种面向对象的设计显著提升了代码复用性。
GPU/CPU无缝切换

通过 .to(device) 方法，张量与模型可在设备间灵活迁移：
python 复制代码
```
device = "cuda" if torch.cuda.is_available() else "cpu"
model = CNN().to(device)
```