nn.functional.softmax(X, dim=-1)

dim=-1表示在最后一个维度(大概率是一行)应用Softmax函数,将值标准化为概率分布。

实例

假设我们有一个张量X,形状为(2,3),内容如下:

复制代码
import torch  
import torch.nn.functional as F  

X = torch.tensor([[1.0, 2.0, 3.0],  
                  [1.0, 2.0, 3.0]])  

# 计算 Softmax  
softmax_result = F.softmax(X, dim=-1)  
print(softmax_result)

输出:

复制代码
tensor([[0.0900, 0.2447, 0.6652],  
        [0.0900, 0.2447, 0.6652]])

可以看到,每一行的输出值加起来为 1,这表示已经进行了Softmax操作。

相关推荐
灰灰勇闯IT1 天前
DeepSeek-R1 在 CANN 上的推理部署
pytorch·python·深度学习
努力学习_小白1 天前
Inception V1——学习记录
pytorch·深度学习·inception v1
5201-1 天前
向量数据库在 NPU 上的加速
数据库·pytorch·python
星河耀银海1 天前
人工智能:注意力机制与Transformer模型实战
人工智能·深度学习·transformer
生成论实验室1 天前
用事件关系网络重新理解AI:自注意力机制、词向量、CNN、GAN、强化学习、Dropout、知识蒸馏
人工智能·深度学习·语言模型·机器人·自动驾驶
ybdesire1 天前
详解大模型DPO训练数据格式
人工智能·深度学习·机器学习
Together_CZ1 天前
DTSemNet :Vanilla Gradient Descent for Oblique Decision Trees——用于倾斜决策树的普通梯度下降
算法·决策树·机器学习·vanilla·gradient·dtsemnet·用于倾斜决策树的普通梯度
文歌子1 天前
认识 Prithvi:NASA × IBM 的遥感基础模型
人工智能·深度学习
txg6661 天前
编译无关的漏洞检测:基于 Transformer 的 LLVM-IR 与汇编鲁棒建模
汇编·深度学习·安全·transformer
一切皆是因缘际会1 天前
人工智能从对话工具向自主生产力跃迁
人工智能·深度学习·ai·重构