pytorch torch.triu函数介绍

torch.triu 是 PyTorch 提供的一个函数,用于生成矩阵的上三角部分。它的名称来源于 "triangular upper"(上三角形),作用是将矩阵的下三角部分置为零,只保留对角线及其上方的元素。

函数签名

复制代码
torch.triu(input, diagonal=0) → Tensor

参数

  • input : 输入的张量,一般是一个二维矩阵(Tensor)。
  • diagonal : 对角线的偏移量,默认值为 0
    • diagonal=0 时,保留主对角线及其上方的元素。
    • diagonal>0 时,向上偏移保留的对角线。偏移的值决定从上三角的第几行开始保留。
    • diagonal<0 时,向下偏移保留的对角线,即包括主对角线下方的部分。

返回值

返回一个与 input 形状相同的张量,但下三角部分的值被置为零。

示例

复制代码
import torch

# 创建一个 3x3 的张量
A = torch.tensor([[1, 2, 3],
                  [4, 5, 6],
                  [7, 8, 9]])

# 获取上三角部分
upper_triangular = torch.triu(A)

print(upper_triangular)

在这个例子中,torch.triu 保留了矩阵 A 的主对角线及其上方的元素,而将下方的元素置为零。

偏移对角线示例

如果我们设置 diagonal1,则只保留主对角线上方的元素:

复制代码
upper_triangular = torch.triu(A, diagonal=1)

print(upper_triangular)

输出为:

复制代码
tensor([[0, 2, 3],
        [0, 0, 6],
        [0, 0, 0]])

应用场景

  • 矩阵运算 : torch.triu 在需要使用上三角矩阵进行特定计算时很有用,比如 Cholesky 分解、图卷积中的邻接矩阵处理。
  • 屏蔽下三角部分: 在一些序列处理任务中,常用上三角掩码来忽略无关的值,例如在自注意力机制中用来避免提前看到未来的序列。
相关推荐
黑心萝卜三条杠10 分钟前
Everywhere Attack:通过多目标植入提升对抗样本的目标迁移性
人工智能
程序员三藏19 分钟前
如何使用Jmeter进行压力测试?
自动化测试·软件测试·python·测试工具·jmeter·测试用例·压力测试
carpell23 分钟前
【语义分割专栏】3:Segnet原理篇
人工智能·python·深度学习·计算机视觉·语义分割
24K纯学渣24 分钟前
Python编码格式化之PEP8编码规范
开发语言·ide·python·pycharm
怒视天下26 分钟前
零基础玩转Python生物信息学:数据分析与算法实现
开发语言·python
ahead~43 分钟前
【大模型原理与技术-毛玉仁】第五章 模型编辑
人工智能·深度学习·机器学习
zhanshuo1 小时前
Python元组黑科技:3招让数据安全暴增200%,学生管理系统实战揭秘!
python
空中湖1 小时前
免费批量图片格式转换工具
图像处理·python·程序人生
迪娜学姐1 小时前
GenSpark vs Manus实测对比:文献综述与学术PPT,哪家强?
论文阅读·人工智能·prompt·powerpoint·论文笔记
TDengine (老段)1 小时前
TDengine 在电力行业如何使用 AI ?
大数据·数据库·人工智能·时序数据库·tdengine·涛思数据