PyTorch张量（Tensor）简介

PyTorch张量（Tensor）是PyTorch的核心数据结构，类似于NumPy的多维数组，但具有更强大的功能。它的主要作用包括：

1. 数据表示与存储

python

复制代码

import torch

# 各种类型的数据表示
scalar = torch.tensor(3.14)          # 标量（0维张量）
vector = torch.tensor([1, 2, 3])     # 向量（1维张量）
matrix = torch.tensor([[1, 2], 
                       [3, 4]])      # 矩阵（2维张量）
tensor_3d = torch.randn(2, 3, 4)     # 3维张量（如批次图像）

2. 自动微分（Autograd）

张量的核心优势：自动计算梯度

python

复制代码

x = torch.tensor([1.0], requires_grad=True)
y = x ** 2 + 3 * x
y.backward()  # 自动计算梯度
print(x.grad)  # 输出: tensor([5.]) dy/dx = 2x + 3 = 5

3. GPU加速计算

python

复制代码

# 在GPU上进行计算（如果可用）
if torch.cuda.is_available():
    tensor_gpu = torch.tensor([1, 2, 3]).cuda()
    result = tensor_gpu * 2  # GPU加速运算

4. 神经网络操作

python

复制代码

import torch.nn as nn

# 张量用于神经网络各层
batch_size = 32
input_data = torch.randn(batch_size, 784)  # 输入数据

# 全连接层
linear_layer = nn.Linear(784, 256)
output = linear_layer(input_data)  # 张量作为输入输出

# 卷积层
images = torch.randn(batch_size, 3, 224, 224)  # 批次图像
conv_layer = nn.Conv2d(3, 64, kernel_size=3)
features = conv_layer(images)

5. 主要应用场景

计算机视觉

python

复制代码

# 图像处理
images = torch.randn(10, 3, 128, 128)  # [批次, 通道, 高, 宽]

# 卷积操作
conv = nn.Conv2d(3, 16, 3)
output = conv(images)

自然语言处理

python

复制代码

# 文本序列处理
batch_size = 4
seq_length = 10
embedding_dim = 300

text_embeddings = torch.randn(batch_size, seq_length, embedding_dim)
# [批次, 序列长度, 词向量维度]

强化学习

python

复制代码

# 状态、动作、奖励的表示
state = torch.tensor([0.5, -0.2, 0.8])  # 环境状态
action = torch.tensor([0.1, 0.9])       # 智能体动作
reward = torch.tensor(1.0)              # 奖励值

6. 核心特性

自动微分追踪

python

复制代码

x = torch.tensor(2.0, requires_grad=True)
w = torch.tensor(1.5, requires_grad=True)
b = torch.tensor(0.7, requires_grad=True)

y = w * x + b
loss = (y - 5) ** 2

loss.backward()  # 自动计算所有梯度
print(w.grad)    # ∂loss/∂w
print(b.grad)    # ∂loss/∂b

设备无关性

python

复制代码

# 同一代码在CPU/GPU上运行
device = 'cuda' if torch.cuda.is_available() else 'cpu'
tensor = torch.tensor([1, 2, 3], device=device)

丰富的操作API

数学运算 : add, mul, matmul
索引切片: 类似NumPy的索引语法
形状操作 : view, reshape, transpose
归约操作 : sum, mean, max

7. 与NumPy互操作

python

复制代码

import numpy as np

# NumPy数组转张量
np_array = np.array([1, 2, 3])
torch_tensor = torch.from_numpy(np_array)

# 张量转NumPy数组
torch_tensor = torch.tensor([4, 5, 6])
np_array = torch_tensor.numpy()

总结

PyTorch张量的主要作用：

统一的数据容器：表示各种维度的数值数据
自动微分引擎：支持动态计算图，便于梯度计算
硬件加速：无缝CPU/GPU切换，提升计算效率
深度学习基础：所有神经网络操作的核心数据结构
灵活的操作：提供丰富的数学运算和形状变换

张量是PyTorch的基石，使得从研究原型到生产部署的整个过程更加顺畅和高效。