tensile/index.rst

.. meta::

:description: Tensile 是一个用于创建以基准测试驱动的 GEMM 后端库的工具

:keywords: Tensile 文档, GEMM, Tensor, 张量, Tensile API

.. _index:


Tensile 文档


Tensile 是一个用于创建以基准测试驱动的后端库的工具,面向通用矩阵-矩阵乘法(General Matrix-Matrix Multiplications,GEMM)、批量 GEMM 等 GEMM 类问题、N 维张量收缩,以及其他任何在 AMD GPU 上对两个多维对象进行乘法运算的计算问题。

Tensile 使用 Python 编写,用于库和内核的生成;使用 C++ 编写,用于客户端头文件和库测试。它是 ROCm 生态系统中的一个关键项目,为诸如 :doc:`rocBLAS <rocblas:index>` 等下游库提供高度优化的内核。

Tensile 中以 Python 编写的部分由一组应用程序组成,这些程序共同负责生成优化后的内核,以及用于从客户端代码访问这些内核的库对象。

该代码是开源的,托管在 `<https://github.com/ROCm/rocm-libraries/tree/develop/shared/tensile\>`_。

.. note::

针对 ROCm 7.0 及更早版本的 Tensile 仓库位于 `<https://github.com/ROCm/tensile\>`_。

.. grid:: 2

:gutter: 2

.. grid-item-card:: 安装

```

* :ref:`installation`

```

.. grid-item-card:: 概念说明

```

* :ref:`解决方案选择目录 <solution-selection-catalogs>`

* :ref:`benchmarking`

* :ref:`kernel-parameters`

```

.. grid-item-card:: 参考

```

* :ref:`CLI 参考 <cli-reference>`

* :ref:`environment-variables`

* :ref:`precision-support`

* :ref:`nomenclature`

```

.. grid-item-card:: 贡献

```

* :ref:`程序员指南 <programmers-guide>`

* :ref:`贡献指南 <contribution-guidelines>`

```

.. grid-item-card:: 教程

```

* :ref:`benchmark-config-example`

```

.. grid-item-card:: 支持

```

* :ref:`troubleshooting`

```

如需为文档做出贡献,请参阅

`为 ROCm 做贡献 <https://rocm.docs.amd.com/en/latest/contribute/contributing.html\>`_。

许可证相关信息可在

`许可 <https://rocm.docs.amd.com/en/latest/about/license.html\>`_ 页面中找到。

相关推荐
TangDuoduo00055 小时前
【Linux字符设备驱动】
linux·驱动开发
Max_uuc5 小时前
【C++ 硬核】摆脱开发板:用 Google Test + Mock 构建嵌入式 TDD (测试驱动开发) 体系
驱动开发·tdd
小龙报6 小时前
【51单片机】串口通讯从入门到精通:原理拆解 + 参数详解 + 51 单片机实战指南
c语言·驱动开发·stm32·单片机·嵌入式硬件·物联网·51单片机
dlz08361 天前
POE驱动开发流程
驱动开发
嵌入式-老费1 天前
Linux camera驱动开发(DVP接口的camera sensor)
驱动开发
VernonJsn2 天前
visual studio 2022的windows驱动开发
ide·驱动开发·visual studio
嵌入式郑工2 天前
RK3566 LubanCat 开发板 USB Gadget 配置完整复盘
linux·驱动开发·ubuntu
雾削木3 天前
树莓派 ESPHome 固件编译与烧录全攻略(解决超时与串口识别问题)
驱动开发
春日见4 天前
win11 分屏设置
java·开发语言·驱动开发·docker·单例模式·计算机外设