【Triton 教程】triton_language.load

Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。

更多 Triton 中文文档可访问 →triton.hyper.ai/

复制代码
triton.language.load(pointer, mask=None, other=None, boundary_check=(), padding_option='', cache_modifier='', eviction_policy='', volatile=False)

返回 1 个数据张量,其值从由指针所定义的内存位置处加载:

1.如果 pointer 是单元素指针,则加载 1 个标量。在这种情况下:

  • maskother 必须也是标量,
  • other 会隐式地转换为 pointer.dtype.element_ty 类型,
  • boundary_checkpadding_option 必须为空。

2.如果 pointer 是 1 个 N 维指针张量,则加载 1 个 N 维张量。在这种情况下:

  • maskother 会被隐式地广播到 pointer.shape
  • other 会隐式地转换为 pointer.dtype.element_ty 类型,
  • boundary_checkpadding_option 必须为空。

3.如果 pointer 是由 make_block_ptr 定义的块指针,则加载 1 个张量。在这种情况下:

  • maskother 必须为 None
  • 可以指定 boundary_checkpadding_option 来控制超出越界访问的行为。

参数**:**

  • pointertriton.PointerType *,*或 dtype=triton.PointerType 的块)- 指向要加载的数据的指针。
  • masktriton.int1 的块 *,*可选)- 如果 maskidx 为 false,则不加载 pointeridx 处的数据(对于块指针必须为 None)。
  • other ( , 可选) - 如果 maskidx 为 false,则返回 otheridx
  • boundary_check整数元组 *,*可选)- 表示应进行边界检查维度的元组。
  • padding_option - 应为 {"", "zero", "nan"} 中的一个,越界时进行填充。
  • cache_modifier **(*str ,可选,*应为 {"", "ca", "cg"} 中的一个 )- 其中「ca」表示在所有层级进行缓存,「cg」表示在全局层级缓存(在 L2 及以下缓存,不是 L1),详细信息请参见缓存操作符。)在 NVIDIA PTX 中更改缓存选项。
  • eviction_policystr , 可选) - 更改 NVIDIA PTX 中的驱逐策略。
  • volatilebool , 可选) - 更改 NVIDIA PTX 中的易失性选项。
相关推荐
运维行者_1 天前
Applications Manager中的Redis监控
大数据·服务器·数据库·人工智能·网络协议
吃好睡好便好1 天前
提取矩阵某一行或某一列元素
开发语言·人工智能·线性代数·算法·matlab·矩阵
AI数字化笔记1 天前
【无标题】
人工智能
悦数图数据库1 天前
图数据库选型指南 2026:从架构、性能、AI 适配三个维度看 悦数科技
数据库·人工智能·架构
北京耐用通信1 天前
自动化工程师必修课:耐达讯自动化Modbus TCP转PROFIBUS协议转换的核心逻辑与应用
人工智能·物联网·网络协议·自动化·信息与通信
无忧智库1 天前
某AI漫剧超级工厂AI绘画与分镜自动化生成流水线详细设计方案(WORD)
人工智能·ai作画·自动化
火山引擎开发者社区1 天前
ArkClaw 全新升级,从 UI 到 Agent 协作全面进化
人工智能
Mininglamp_27181 天前
会中 AI Skill 架构设计解析:3 种人设 × 7 种能力的技术实现
人工智能·语音识别·硬件·ai agent·skill
墨神谕1 天前
人工智能(三)— 神经网络的训练
人工智能·神经网络·机器学习
RyFit1 天前
Java + AI 实战:Spring AI 从入门到企业级落地
java·人工智能·spring