【pyTorch】关于PyTorch的高级索引机制理解

python 复制代码
y_hat[[0, 1], y]

看起来简短,其实包含了 PyTorch 的高级索引(advanced indexing) 机制,

常用于分类任务中,从模型输出中取出正确类别对应的预测概率(或分数)

我们来一步步拆解 👇


🧩 一、先看变量定义

python 复制代码
y = torch.tensor([0, 2])
y_hat = torch.tensor([
    [0.1, 0.3, 0.6],
    [0.3, 0.2, 0.5]
])

可以理解为:

样本编号 模型预测概率(3类) 正确类别
第 0 个样本 [0.1, 0.3, 0.6] 0
第 1 个样本 [0.3, 0.2, 0.5] 2

🧮 二、代码含义

python 复制代码
y_hat[[0, 1], y]

这是一个行列双索引操作,等价于:

python 复制代码
torch.tensor([y_hat[0, y[0]], y_hat[1, y[1]]])

也就是:

复制代码
= [y_hat[0, 0], y_hat[1, 2]]

📊 三、一步步替换求值

从矩阵中取出对应元素:

索引 取出的元素
y_hat[0, 0] 第 0 行第 0 列 0.1
y_hat[1, 2] 第 1 行第 2 列 0.5

所以:

python 复制代码
y_hat[[0, 1], y] = tensor([0.1, 0.5])

🧠 四、这个操作在深度学习中的用途

这个技巧非常常见!尤其是在 交叉熵损失 (cross-entropy) 计算中。

假设 y_hat 是每个样本对所有类别的预测概率分布,y 是正确标签,

那这行代码可以提取出:

每个样本 "对应正确类别" 的预测概率。

例如:

python 复制代码
y_hat[[0, 1], y]
# → tensor([预测第0个样本属于真实类别的概率, 
#           预测第1个样本属于真实类别的概率])

然后就可以算交叉熵:

python 复制代码
loss = -torch.log(y_hat[[0, 1], y])

✅ 五、总结一句话

代码 含义
y_hat[[0, 1], y] 按行索引 [0, 1] 和对应列索引 y 同时取元素
= [y_hat[0, y[0]], y_hat[1, y[1]]] 等价的展开写法
结果 取出每个样本的正确类别预测值(常用于分类任务)

💡 口诀记忆:

y_hat[行索引, 列索引]

会"对齐"地从每一行中取出对应列的元素。

常用来拿到"每个样本在真实类别上的预测概率"。


具体理解

🧩 数据回顾

python 复制代码
y = torch.tensor([0, 2])
y_hat = torch.tensor([
    [0.1, 0.3, 0.6],
    [0.3, 0.2, 0.5]
])

🎨 图示说明

复制代码
          类别0    类别1    类别2
样本0 →   0.1      0.3      0.6
样本1 →   0.3      0.2      0.5

以及标签:

复制代码
y = [0, 2]

表示:

  • 样本 0 的真实类别是 0
  • 样本 1 的真实类别是 2

🔍 执行这句代码:

python 复制代码
y_hat[[0, 1], y]

等价于:

复制代码
取第 0 行的第 y[0]=0 列 → 0.1
取第 1 行的第 y[1]=2 列 → 0.5

✅ 可视化标注结果

复制代码
          类别0    类别1    类别2
样本0 →  [0.1]*    0.3      0.6
样本1 →   0.3      0.2    [0.5]*

星号 * 表示被选中的元素

最终输出:

复制代码
tensor([0.1, 0.5])

🧠 用途回顾

在分类任务里:

python 复制代码
loss = -torch.log(y_hat[[0, 1], y])

就是取出模型对真实标签类别的预测概率,再取负对数计算交叉熵损失。

相关推荐
小真zzz18 小时前
2026年GEO监测工具深度横评:谁在AI时代守护品牌心智?
人工智能·百度·重构
ZFSS18 小时前
Localization Translate API 集成与使用指南
java·服务器·数据库·人工智能·mysql·ai编程
TechWayfarer18 小时前
查询IP所在地的3种方案:从API到离线库,风控场景怎么选?
开发语言·网络·python·网络协议·tcp/ip
天行健,君子而铎18 小时前
合规对标·低误报漏报·稳定运行——知源-AI数据分类分级系统金融行业解决方案
人工智能·金融·分类
视觉&物联智能19 小时前
【杂谈】-游戏生成数据:人工智能训练中极易被低估的核心资源
人工智能·游戏·ai·chatgpt·openai·agi·deepseek
程序员榴莲19 小时前
Python 单例模式
开发语言·python·单例模式
扫地的小何尚19 小时前
NVIDIA Vera Rubin 平台如何解决 Agentic AI 的 Scale-up 难题
大数据·人工智能·机器学习
hh.h.19 小时前
昇腾CANN ops-transformer 仓的 MC2 算子:MoE 模型的全到全通信
python·深度学习·transformer·cann
莞凰19 小时前
昇腾CANN的“灵脉根基“:Runtime仓库探秘
android·人工智能·transformer
5201-20 小时前
ops-conv:卷积算子从 CPU 到昇腾 NPU 的优化之路
人工智能·深度学习