pytorch torch.triu函数介绍

torch.triu 是 PyTorch 提供的一个函数,用于生成矩阵的上三角部分。它的名称来源于 "triangular upper"(上三角形),作用是将矩阵的下三角部分置为零,只保留对角线及其上方的元素。

函数签名

复制代码
torch.triu(input, diagonal=0) → Tensor

参数

  • input : 输入的张量,一般是一个二维矩阵(Tensor)。
  • diagonal : 对角线的偏移量,默认值为 0
    • diagonal=0 时,保留主对角线及其上方的元素。
    • diagonal>0 时,向上偏移保留的对角线。偏移的值决定从上三角的第几行开始保留。
    • diagonal<0 时,向下偏移保留的对角线,即包括主对角线下方的部分。

返回值

返回一个与 input 形状相同的张量,但下三角部分的值被置为零。

示例

复制代码
import torch

# 创建一个 3x3 的张量
A = torch.tensor([[1, 2, 3],
                  [4, 5, 6],
                  [7, 8, 9]])

# 获取上三角部分
upper_triangular = torch.triu(A)

print(upper_triangular)

在这个例子中,torch.triu 保留了矩阵 A 的主对角线及其上方的元素,而将下方的元素置为零。

偏移对角线示例

如果我们设置 diagonal1,则只保留主对角线上方的元素:

复制代码
upper_triangular = torch.triu(A, diagonal=1)

print(upper_triangular)

输出为:

复制代码
tensor([[0, 2, 3],
        [0, 0, 6],
        [0, 0, 0]])

应用场景

  • 矩阵运算 : torch.triu 在需要使用上三角矩阵进行特定计算时很有用,比如 Cholesky 分解、图卷积中的邻接矩阵处理。
  • 屏蔽下三角部分: 在一些序列处理任务中,常用上三角掩码来忽略无关的值,例如在自注意力机制中用来避免提前看到未来的序列。
相关推荐
造梦师阿鹏6 分钟前
AI时代的结对编程:双模型协同,人主导的高效开发新范式
人工智能·结对编程
连线Insight11 分钟前
理想发布MindVLA-o1:一个模型,如何真正理解3D世界?
人工智能
小小小米粒11 分钟前
[特殊字符] 正常部署 AI + 流式输出(Stream)[特殊字符] 为什么会 CPU 炸了?
开发语言·python
站大爷IP14 分钟前
Python异步编程:asyncio核心用法与避坑指南
python
AINative软件工程17 分钟前
通义千问 vs DeepSeek:国产大模型编程能力横评 2026
人工智能
Jackson_Li18 分钟前
大多数人对 Claude Code Skills 的理解,在第一步就错了
人工智能·设计模式
Daydream.V20 分钟前
卷积神经网络——附水果分类案例及参数优化
人工智能·分类·cnn·卷积神经网络
地平线开发者21 分钟前
【地平线J6工具链入门教程】J5到J6算法部署迁移指南
人工智能·算法·自动驾驶·汽车
m0_5879589522 分钟前
游戏与图形界面(GUI)
jvm·数据库·python
不剪发的Tony老师26 分钟前
Spyder:一款面向数据科学的Python集成开发环境
ide·python