pytorch torch.triu函数介绍

torch.triu 是 PyTorch 提供的一个函数,用于生成矩阵的上三角部分。它的名称来源于 "triangular upper"(上三角形),作用是将矩阵的下三角部分置为零,只保留对角线及其上方的元素。

函数签名

复制代码
torch.triu(input, diagonal=0) → Tensor

参数

  • input : 输入的张量,一般是一个二维矩阵(Tensor)。
  • diagonal : 对角线的偏移量,默认值为 0
    • diagonal=0 时,保留主对角线及其上方的元素。
    • diagonal>0 时,向上偏移保留的对角线。偏移的值决定从上三角的第几行开始保留。
    • diagonal<0 时,向下偏移保留的对角线,即包括主对角线下方的部分。

返回值

返回一个与 input 形状相同的张量,但下三角部分的值被置为零。

示例

复制代码
import torch

# 创建一个 3x3 的张量
A = torch.tensor([[1, 2, 3],
                  [4, 5, 6],
                  [7, 8, 9]])

# 获取上三角部分
upper_triangular = torch.triu(A)

print(upper_triangular)

在这个例子中,torch.triu 保留了矩阵 A 的主对角线及其上方的元素,而将下方的元素置为零。

偏移对角线示例

如果我们设置 diagonal1,则只保留主对角线上方的元素:

复制代码
upper_triangular = torch.triu(A, diagonal=1)

print(upper_triangular)

输出为:

复制代码
tensor([[0, 2, 3],
        [0, 0, 6],
        [0, 0, 0]])

应用场景

  • 矩阵运算 : torch.triu 在需要使用上三角矩阵进行特定计算时很有用,比如 Cholesky 分解、图卷积中的邻接矩阵处理。
  • 屏蔽下三角部分: 在一些序列处理任务中,常用上三角掩码来忽略无关的值,例如在自注意力机制中用来避免提前看到未来的序列。
相关推荐
cup1129 分钟前
[技术复盘] Windows Python 打包实战:Nuitka 环境踩坑总结与 CI 自动化构建全指南
python·ai·环境变量·ci·nuitka·skill
aqi003 小时前
15天学会AI应用开发(七)有了大模型为什么还要引入RAG
人工智能·python·大模型·ai编程·ai应用
用户5191495848453 小时前
libcurl Headers API 释放后重利用漏洞:跨请求复用头句柄导致堆内存安全风险
人工智能·aigc
踩蚂蚁3 小时前
自定义语音唤醒词:从训练到部署的完整链路实践
人工智能
用户5191495848454 小时前
CVE-2025-1094 PostgreSQL SQL注入与WebSocket劫持远程代码执行利用工具
人工智能·aigc
金銀銅鐵4 小时前
用 Python 实现 Take-Away 游戏
python·游戏
IT_陈寒5 小时前
SpringBoot自动配置这个坑,我踩进去又爬出来了
前端·人工智能·后端
copyer_xyf5 小时前
Agent 流程编排
后端·python·agent
copyer_xyf6 小时前
Agent RAG
后端·python·agent