tensile/index.rst

.. meta::

:description: Tensile 是一个用于创建以基准测试驱动的 GEMM 后端库的工具

:keywords: Tensile 文档, GEMM, Tensor, 张量, Tensile API

.. _index:


Tensile 文档


Tensile 是一个用于创建以基准测试驱动的后端库的工具,面向通用矩阵-矩阵乘法(General Matrix-Matrix Multiplications,GEMM)、批量 GEMM 等 GEMM 类问题、N 维张量收缩,以及其他任何在 AMD GPU 上对两个多维对象进行乘法运算的计算问题。

Tensile 使用 Python 编写,用于库和内核的生成;使用 C++ 编写,用于客户端头文件和库测试。它是 ROCm 生态系统中的一个关键项目,为诸如 :doc:`rocBLAS <rocblas:index>` 等下游库提供高度优化的内核。

Tensile 中以 Python 编写的部分由一组应用程序组成,这些程序共同负责生成优化后的内核,以及用于从客户端代码访问这些内核的库对象。

该代码是开源的,托管在 `<https://github.com/ROCm/rocm-libraries/tree/develop/shared/tensile\>`_。

.. note::

针对 ROCm 7.0 及更早版本的 Tensile 仓库位于 `<https://github.com/ROCm/tensile\>`_。

.. grid:: 2

:gutter: 2

.. grid-item-card:: 安装

```

* :ref:`installation`

```

.. grid-item-card:: 概念说明

```

* :ref:`解决方案选择目录 <solution-selection-catalogs>`

* :ref:`benchmarking`

* :ref:`kernel-parameters`

```

.. grid-item-card:: 参考

```

* :ref:`CLI 参考 <cli-reference>`

* :ref:`environment-variables`

* :ref:`precision-support`

* :ref:`nomenclature`

```

.. grid-item-card:: 贡献

```

* :ref:`程序员指南 <programmers-guide>`

* :ref:`贡献指南 <contribution-guidelines>`

```

.. grid-item-card:: 教程

```

* :ref:`benchmark-config-example`

```

.. grid-item-card:: 支持

```

* :ref:`troubleshooting`

```

如需为文档做出贡献,请参阅

`为 ROCm 做贡献 <https://rocm.docs.amd.com/en/latest/contribute/contributing.html\>`_。

许可证相关信息可在

`许可 <https://rocm.docs.amd.com/en/latest/about/license.html\>`_ 页面中找到。

相关推荐
进击的小头13 小时前
20_第20篇:嵌入式外设驱动开发基础:寄存器级开发与库函数开发对比实战
arm开发·驱动开发·单片机
低调小一13 小时前
BDD(行为驱动开发)入门:把“测试”写成“行为”,把“需求”写成“场景”
驱动开发·tdd·bdd
charlie11451419114 小时前
嵌入式Linux驱动开发(7) 从虚拟设备到真实硬件 —— LED驱动硬件基础
linux·开发语言·驱动开发·内核·c
莎士比亚的文学花园18 小时前
Linux驱动开发(2)——驱动编程
linux·运维·驱动开发
2601_9496955919 小时前
开源AI智能体OpenClaw接入DeepSeek V4全流程:从配置到成本
人工智能·驱动开发·ai·电脑
枳实-叶20 小时前
【Linux驱动开发】第二天:内核模块生命周期+内存分配全解
linux·驱动开发
嵌入式小企鹅20 小时前
CPU需求变化、RISC-V安全方案、DeepSeek V4适配、太空算力动态
人工智能·驱动开发·华为·开源·算力·risc-v
智者知已应修善业2 天前
【触发器种类和真值表】2023-7-5
驱动开发·经验分享·笔记·硬件架构·硬件工程
枳实-叶2 天前
【Linux驱动开发】第一天:用户态与内核态通俗讲解+最简字符设备驱动实战
linux·驱动开发·学习
nix.gnehc3 天前
读懂 OpenSpec:AI 编码时代的规范驱动开发新范式
人工智能·驱动开发·sdd·openspec