pytorch torch.nn.functional.one_hot函数介绍

torch.nn.functional.one_hot 是 PyTorch 中用于生成独热编码(one-hot encoding)张量的函数。独热编码是一种常用的编码方式,特别适用于分类任务或对离散的类别标签进行处理。该函数将整数张量的每个元素转换为一个独热向量。

函数签名

复制代码
torch.nn.functional.one_hot(tensor, num_classes=-1)

参数

  1. tensor:

    • 输入的整数张量。该张量的每个元素都表示一个类别索引。
    • tensor 的数据类型必须是整数类型(如 torch.LongTensortorch.IntTensor)。
  2. num_classes:

    • 输出独热编码向量的长度,即类别的总数。如果设置为默认值 -1,则 num_classes 会自动设置为输入张量中最大值加1,即 max(tensor) + 1
    • 如果指定 num_classes,生成的每个独热向量的长度就是 num_classes,即使某些类别索引可能小于该值。

输出

  • 输出是一个新张量,其中输入张量的每个整数都被转换为一个独热编码向量。
  • 输出张量的形状为:(*input_shape, num_classes),即在输入张量的最后增加一个维度,代表类别的独热编码。

独热编码示例

独热编码是指在一个向量中,只有一个位置是1,其余位置都是0。例如,如果有三个类别,类别0可以表示为 [1, 0, 0],类别1 表示为 [0, 1, 0],类别2 表示为 [0, 0, 1]

示例

示例 1:简单独热编码
复制代码
import torch
import torch.nn.functional as F

# 假设有类别索引 [0, 1, 2]
labels = torch.tensor([0, 1, 2])
one_hot = F.one_hot(labels, num_classes=3)

print(one_hot)

输出:

复制代码
tensor([[1, 0, 0],
        [0, 1, 0],
        [0, 0, 1]])

在这里,类别索引 [0, 1, 2] 分别被编码为独热向量 [1, 0, 0], [0, 1, 0][0, 0, 1]

示例 2:自定义类别数量
复制代码
# 输入类别索引为 [0, 1, 4]
labels = torch.tensor([0, 1, 4])
one_hot = F.one_hot(labels, num_classes=5)

print(one_hot)

输出:

复制代码
tensor([[1, 0, 0, 0, 0],
        [0, 1, 0, 0, 0],
        [0, 0, 0, 0, 1]])

即使 labels 中最大值是 4,指定了 num_classes=5,独热向量的长度为 5。

示例 3:多维输入
复制代码
# 输入为二维张量
labels = torch.tensor([[0, 1], [2, 3]])
one_hot = F.one_hot(labels, num_classes=4)

print(one_hot)

输出:

复制代码
tensor([[[1, 0, 0, 0],
         [0, 1, 0, 0]],

        [[0, 0, 1, 0],
         [0, 0, 0, 1]]])

输出张量的形状为 (2, 2, 4),即在输入形状 (2, 2) 的基础上,在最后增加了一个维度来表示类别的独热编码。

应用场景

  1. 分类任务: 在神经网络的分类任务中,通常需要将类别标签转换为独热编码。例如在多分类问题中,将标签转换为独热编码后,可以与交叉熵损失函数配合使用。

  2. 序列数据处理: 在自然语言处理任务中,可以使用独热编码将词汇表中的每个单词转换为独热向量,表示该单词在词汇表中的位置。

  3. 距离计算: 在某些算法中,使用独热编码表示类别或索引可以帮助计算不同类别或位置之间的距离。

总结

torch.nn.functional.one_hot 是一个简单但强大的工具,用于将整数标签或类别索引转换为独热编码。它通常用于分类问题的标签预处理,特别是在多类别分类任务中非常有用。

相关推荐
通信小呆呆11 小时前
当算法有了“五感”:多模态数据融合如何向人体感官协同学习?
人工智能·学习·算法·机器学习·机器人
程序猿追11 小时前
那个右下角的小数字怎么“卡”住我打字——我用 HarmonyOS 自己写了一个字数限制输入框
pytorch·华为·harmonyos
xiao5kou4chang6kai411 小时前
MATLAB机器学习、深度学习--从数据预处理到模型训练
深度学习·机器学习·matlab·数据预处理
renhongxia112 小时前
世界模型作为AGI落地底层底座的作用
人工智能·深度学习·生成对抗网络·自然语言处理·知识图谱·agi
计算机科研狗@OUC12 小时前
(cvpr26) AIMDepth: Asymmetric Image-Event Mamba for Monocular Depth Estimation
人工智能·深度学习·计算机视觉
code_pgf12 小时前
端到端自动驾驶 BEV stack
人工智能·机器学习·自动驾驶
闵孚龙13 小时前
《PyTorch 深度修炼》Dataset 和 DataLoader:数据如何喂给模型
人工智能·pytorch·python
Godspeed Zhao13 小时前
Level 4自动驾驶系统设计3——功能与场景3
人工智能·机器学习·自动驾驶
H1785350909614 小时前
SolidWorks第四部分_直接实体建模特征9_替换面原理
线性代数·算法·机器学习·3d建模·solidworks
Godspeed Zhao14 小时前
现代智能汽车系统——智驾SoC之框架版图
人工智能·机器学习·自动驾驶·汽车·soc