nn.functional.softmax(X, dim=-1)

dim=-1表示在最后一个维度(大概率是一行)应用Softmax函数,将值标准化为概率分布。

实例

假设我们有一个张量X,形状为(2,3),内容如下:

复制代码
import torch  
import torch.nn.functional as F  

X = torch.tensor([[1.0, 2.0, 3.0],  
                  [1.0, 2.0, 3.0]])  

# 计算 Softmax  
softmax_result = F.softmax(X, dim=-1)  
print(softmax_result)

输出:

复制代码
tensor([[0.0900, 0.2447, 0.6652],  
        [0.0900, 0.2447, 0.6652]])

可以看到,每一行的输出值加起来为 1,这表示已经进行了Softmax操作。

相关推荐
灰灰勇闯IT38 分钟前
DeepSeek-R1 在 CANN 上的推理部署
pytorch·python·深度学习
努力学习_小白1 小时前
Inception V1——学习记录
pytorch·深度学习·inception v1
5201-2 小时前
向量数据库在 NPU 上的加速
数据库·pytorch·python
星河耀银海2 小时前
人工智能:注意力机制与Transformer模型实战
人工智能·深度学习·transformer
生成论实验室2 小时前
用事件关系网络重新理解AI:自注意力机制、词向量、CNN、GAN、强化学习、Dropout、知识蒸馏
人工智能·深度学习·语言模型·机器人·自动驾驶
ybdesire2 小时前
详解大模型DPO训练数据格式
人工智能·深度学习·机器学习
Together_CZ2 小时前
DTSemNet :Vanilla Gradient Descent for Oblique Decision Trees——用于倾斜决策树的普通梯度下降
算法·决策树·机器学习·vanilla·gradient·dtsemnet·用于倾斜决策树的普通梯度
文歌子2 小时前
认识 Prithvi:NASA × IBM 的遥感基础模型
人工智能·深度学习
txg6663 小时前
编译无关的漏洞检测:基于 Transformer 的 LLVM-IR 与汇编鲁棒建模
汇编·深度学习·安全·transformer
一切皆是因缘际会3 小时前
人工智能从对话工具向自主生产力跃迁
人工智能·深度学习·ai·重构