pytorch torch.triu函数介绍

torch.triu 是 PyTorch 提供的一个函数,用于生成矩阵的上三角部分。它的名称来源于 "triangular upper"(上三角形),作用是将矩阵的下三角部分置为零,只保留对角线及其上方的元素。

函数签名

复制代码
torch.triu(input, diagonal=0) → Tensor

参数

  • input : 输入的张量,一般是一个二维矩阵(Tensor)。
  • diagonal : 对角线的偏移量,默认值为 0
    • diagonal=0 时,保留主对角线及其上方的元素。
    • diagonal>0 时,向上偏移保留的对角线。偏移的值决定从上三角的第几行开始保留。
    • diagonal<0 时,向下偏移保留的对角线,即包括主对角线下方的部分。

返回值

返回一个与 input 形状相同的张量,但下三角部分的值被置为零。

示例

复制代码
import torch

# 创建一个 3x3 的张量
A = torch.tensor([[1, 2, 3],
                  [4, 5, 6],
                  [7, 8, 9]])

# 获取上三角部分
upper_triangular = torch.triu(A)

print(upper_triangular)

在这个例子中,torch.triu 保留了矩阵 A 的主对角线及其上方的元素,而将下方的元素置为零。

偏移对角线示例

如果我们设置 diagonal1,则只保留主对角线上方的元素:

复制代码
upper_triangular = torch.triu(A, diagonal=1)

print(upper_triangular)

输出为:

复制代码
tensor([[0, 2, 3],
        [0, 0, 6],
        [0, 0, 0]])

应用场景

  • 矩阵运算 : torch.triu 在需要使用上三角矩阵进行特定计算时很有用,比如 Cholesky 分解、图卷积中的邻接矩阵处理。
  • 屏蔽下三角部分: 在一些序列处理任务中,常用上三角掩码来忽略无关的值,例如在自注意力机制中用来避免提前看到未来的序列。
相关推荐
jinxindeep17 小时前
CVPR26 Best Papar:D4RT,以查询为钥,开启动态场景高效重建新范式
人工智能
hai31524754317 小时前
FlashAttention C语言(C++)实现(展示版)
c语言·开发语言·c++·人工智能·算法
林爷万福17 小时前
光谱数据预处理:基线校正、平滑去噪实战
人工智能·算法
继续商行17 小时前
KV Cache内存管理优化:从碎片整理到智能淘汰的显存优化路径
人工智能
CTA终结者17 小时前
期货量化下单前资金怎么核对:天勤 get_account 与可用、权益字段
python·区块链
IT_陈寒17 小时前
被Vite的动态导入坑了一整天,原来问题出在这
前端·人工智能·后端
zyl8372117 小时前
Python NumPy 学习
python·学习·numpy
wubba lubba dub dub75017 小时前
第四十九周学习周报
人工智能·算法·机器学习
装不满的克莱因瓶18 小时前
学习使用 Python 机器学习工具 sklearn
人工智能·python·学习·机器学习·ai·agent·智能体
辣椒思密达18 小时前
Python HTTP请求中的重试与超时控制:提升稳定性的实用方法
开发语言·python·http