data.TensorDataset
是 PyTorch 中的一个类,用于创建一个包含多个张量的数据集。这个类的主要作用是将输入的张量组合成一个数据集,使得在训练过程中可以方便地进行数据加载和迭代。
具体来说,TensorDataset
接受一系列的张量作为输入参数,并且将这些张量作为数据集的元素。在实际应用中,通常将特征张量和标签张量作为输入,每个样本的特征和标签分别对应一个位置上的张量。
下面是一个简单的例子,说明如何使用 TensorDataset
:shu
python
import torch
from torch.utils.data import TensorDataset
# 假设有特征张量 features 和标签张量 labels
features = torch.tensor([[1.0, 2.0], [3.0, 4.0], [5.0, 6.0]])
labels = torch.tensor([0, 1, 0])
# 使用 TensorDataset 创建数据集
dataset = TensorDataset(features, labels)
# 可以通过索引访问数据集中的元素
sample = dataset[0]
print("First sample:", sample)
print("Second sample:", dataset[1])
输出: