tensile/index.rst

.. meta::

:description: Tensile 是一个用于创建以基准测试驱动的 GEMM 后端库的工具

:keywords: Tensile 文档, GEMM, Tensor, 张量, Tensile API

.. _index:


Tensile 文档


Tensile 是一个用于创建以基准测试驱动的后端库的工具,面向通用矩阵-矩阵乘法(General Matrix-Matrix Multiplications,GEMM)、批量 GEMM 等 GEMM 类问题、N 维张量收缩,以及其他任何在 AMD GPU 上对两个多维对象进行乘法运算的计算问题。

Tensile 使用 Python 编写,用于库和内核的生成;使用 C++ 编写,用于客户端头文件和库测试。它是 ROCm 生态系统中的一个关键项目,为诸如 :doc:`rocBLAS <rocblas:index>` 等下游库提供高度优化的内核。

Tensile 中以 Python 编写的部分由一组应用程序组成,这些程序共同负责生成优化后的内核,以及用于从客户端代码访问这些内核的库对象。

该代码是开源的,托管在 `<https://github.com/ROCm/rocm-libraries/tree/develop/shared/tensile\>`_。

.. note::

针对 ROCm 7.0 及更早版本的 Tensile 仓库位于 `<https://github.com/ROCm/tensile\>`_。

.. grid:: 2

:gutter: 2

.. grid-item-card:: 安装

```

* :ref:`installation`

```

.. grid-item-card:: 概念说明

```

* :ref:`解决方案选择目录 <solution-selection-catalogs>`

* :ref:`benchmarking`

* :ref:`kernel-parameters`

```

.. grid-item-card:: 参考

```

* :ref:`CLI 参考 <cli-reference>`

* :ref:`environment-variables`

* :ref:`precision-support`

* :ref:`nomenclature`

```

.. grid-item-card:: 贡献

```

* :ref:`程序员指南 <programmers-guide>`

* :ref:`贡献指南 <contribution-guidelines>`

```

.. grid-item-card:: 教程

```

* :ref:`benchmark-config-example`

```

.. grid-item-card:: 支持

```

* :ref:`troubleshooting`

```

如需为文档做出贡献,请参阅

`为 ROCm 做贡献 <https://rocm.docs.amd.com/en/latest/contribute/contributing.html\>`_。

许可证相关信息可在

`许可 <https://rocm.docs.amd.com/en/latest/about/license.html\>`_ 页面中找到。

相关推荐
春日见15 小时前
车载系统中的CPU与内存监管
java·开发语言·驱动开发·docker·计算机外设
黑不溜秋的15 小时前
驱动开发系列82 – Mesa NIR 和 SPIRV 的Debug方法
驱动开发
_Emma_16 小时前
【Raspberry PI】Raspberry PiSP摄像头前端(rpl-cfe)
linux·驱动开发
阿拉斯攀登16 小时前
第 8 篇 RK 平台安卓驱动实战 1:GPIO 输入输出驱动,从内核到 App 全流程打通
android·驱动开发·rk3568·瑞芯微·rk安卓驱动
yzx9910132 天前
从命令行到认知时代:GitHub 指令使用与自动化工作流深度实践
驱动开发·自动化·github
凉、介2 天前
深入 LWIP:数据是如何被封装并发送出去的
网络·驱动开发·笔记·学习·嵌入式
阿拉斯攀登2 天前
第 7 篇 安卓驱动开发的灵魂:字符设备驱动框架,从原理到最简实战
android·驱动开发·rk3568·嵌入式驱动·安卓驱动
阿拉斯攀登2 天前
第 1 篇 入坑不亏!瑞芯微 RK 平台 + 安卓驱动开发,小白全维度扫盲
android·驱动开发·rk3568·嵌入式驱动
春日见3 天前
端到端大模型自动驾驶
java·开发语言·驱动开发·docker·自动驾驶·计算机外设
Lueeee.3 天前
Linux下的ULN2003驱动板与28BYJ-48步进电机驱动移植
linux·驱动开发