pytorch torch.triu函数介绍

torch.triu 是 PyTorch 提供的一个函数,用于生成矩阵的上三角部分。它的名称来源于 "triangular upper"(上三角形),作用是将矩阵的下三角部分置为零,只保留对角线及其上方的元素。

函数签名

复制代码
torch.triu(input, diagonal=0) → Tensor

参数

  • input : 输入的张量,一般是一个二维矩阵(Tensor)。
  • diagonal : 对角线的偏移量,默认值为 0
    • diagonal=0 时,保留主对角线及其上方的元素。
    • diagonal>0 时,向上偏移保留的对角线。偏移的值决定从上三角的第几行开始保留。
    • diagonal<0 时,向下偏移保留的对角线,即包括主对角线下方的部分。

返回值

返回一个与 input 形状相同的张量,但下三角部分的值被置为零。

示例

复制代码
import torch

# 创建一个 3x3 的张量
A = torch.tensor([[1, 2, 3],
                  [4, 5, 6],
                  [7, 8, 9]])

# 获取上三角部分
upper_triangular = torch.triu(A)

print(upper_triangular)

在这个例子中,torch.triu 保留了矩阵 A 的主对角线及其上方的元素,而将下方的元素置为零。

偏移对角线示例

如果我们设置 diagonal1,则只保留主对角线上方的元素:

复制代码
upper_triangular = torch.triu(A, diagonal=1)

print(upper_triangular)

输出为:

复制代码
tensor([[0, 2, 3],
        [0, 0, 6],
        [0, 0, 0]])

应用场景

  • 矩阵运算 : torch.triu 在需要使用上三角矩阵进行特定计算时很有用,比如 Cholesky 分解、图卷积中的邻接矩阵处理。
  • 屏蔽下三角部分: 在一些序列处理任务中,常用上三角掩码来忽略无关的值,例如在自注意力机制中用来避免提前看到未来的序列。
相关推荐
阿里云大数据AI技术16 小时前
EMR Serverless StarRocks 湖仓多模态检索:One SQL on One Data,实现全文 + 标量 + 向量三路混合检索
人工智能
金銀銅鐵16 小时前
[Python] 体验用欧几里得算法计算最大公约数的过程
python·数学
冬奇Lab17 小时前
Skill 系列(02):Skill 安全风险——三类攻击面的实战测试
人工智能·安全·开源
冬奇Lab17 小时前
每日一个开源项目(第138篇):OpenMontage - 把 AI 编程助手变成完整的视频制作团队
人工智能·开源·claude
米小虾17 小时前
智谱港股盘中市值突破万亿港元!GLM-5.2 开源引爆国产 AI 价值重估
人工智能·chatglm (智谱)
阿里云大数据AI技术17 小时前
义乌小商品城基于MaxFrame AI Function的亿级AI 数据产线提速之路
人工智能
甲维斯18 小时前
用AI还原《坦克大战》并3D化升级!
前端·人工智能·游戏开发
IT_陈寒19 小时前
SpringBoot自动配置坑了我一晚上,原来问题出在这
前端·人工智能·后端
FreakStudio20 小时前
W55MH32L-EVB 上手测评:硬件 TCP/IP 加持的以太网单片机,MicroPython 零门槛开发
python·单片机·嵌入式·大学生·面向对象·并行计算·电子diy·电子计算机