tensile/index.rst

.. meta::

:description: Tensile 是一个用于创建以基准测试驱动的 GEMM 后端库的工具

:keywords: Tensile 文档, GEMM, Tensor, 张量, Tensile API

.. _index:


Tensile 文档


Tensile 是一个用于创建以基准测试驱动的后端库的工具,面向通用矩阵-矩阵乘法(General Matrix-Matrix Multiplications,GEMM)、批量 GEMM 等 GEMM 类问题、N 维张量收缩,以及其他任何在 AMD GPU 上对两个多维对象进行乘法运算的计算问题。

Tensile 使用 Python 编写,用于库和内核的生成;使用 C++ 编写,用于客户端头文件和库测试。它是 ROCm 生态系统中的一个关键项目,为诸如 :doc:`rocBLAS <rocblas:index>` 等下游库提供高度优化的内核。

Tensile 中以 Python 编写的部分由一组应用程序组成,这些程序共同负责生成优化后的内核,以及用于从客户端代码访问这些内核的库对象。

该代码是开源的,托管在 `<https://github.com/ROCm/rocm-libraries/tree/develop/shared/tensile\>`_。

.. note::

针对 ROCm 7.0 及更早版本的 Tensile 仓库位于 `<https://github.com/ROCm/tensile\>`_。

.. grid:: 2

:gutter: 2

.. grid-item-card:: 安装

```

* :ref:`installation`

```

.. grid-item-card:: 概念说明

```

* :ref:`解决方案选择目录 <solution-selection-catalogs>`

* :ref:`benchmarking`

* :ref:`kernel-parameters`

```

.. grid-item-card:: 参考

```

* :ref:`CLI 参考 <cli-reference>`

* :ref:`environment-variables`

* :ref:`precision-support`

* :ref:`nomenclature`

```

.. grid-item-card:: 贡献

```

* :ref:`程序员指南 <programmers-guide>`

* :ref:`贡献指南 <contribution-guidelines>`

```

.. grid-item-card:: 教程

```

* :ref:`benchmark-config-example`

```

.. grid-item-card:: 支持

```

* :ref:`troubleshooting`

```

如需为文档做出贡献,请参阅

`为 ROCm 做贡献 <https://rocm.docs.amd.com/en/latest/contribute/contributing.html\>`_。

许可证相关信息可在

`许可 <https://rocm.docs.amd.com/en/latest/about/license.html\>`_ 页面中找到。

相关推荐
凉、介1 天前
Flash 块设备驱动开发
c语言·驱动开发·笔记·学习·操作系统·嵌入式
泰白聊AI1 天前
AI 编程时代的规范驱动开发:OpenSpec 实践指南
服务器·人工智能·驱动开发·ai·aigc·ai编程
我爱吃土豆12 天前
Gin响应形式
驱动开发·gin
_Emma_3 天前
【QCOM】 Linux下qcom venus 编解码驱动框架分析
linux·驱动开发·视频编解码
春日见3 天前
TEST文件夹:Pytest,集成测试,单元测试
服务器·人工智能·驱动开发·单元测试·计算机外设·集成测试·pytest
清水白石0083 天前
Python 项目 CI/CD 信心模型:证据驱动部署,从“勇敢上线”到“零风险发版”实战指南
驱动开发·python·ci/cd
A.说学逗唱的Coke3 天前
【AI协同软件工程】规范驱动开发工具全景解析:OpenSpec、SpecKit与传统SDD工具深度对比指南
人工智能·驱动开发·软件工程
国医中兴4 天前
Flutter 三方库 pickled_cucumber 的鸿蒙化适配指南 - 玩转 BDD 行为驱动开发、Gherkin 自动化测试实战、鸿蒙级质量守护神
驱动开发·flutter·harmonyos
tdhao8884 天前
部署 VS2022 驱动开发环境-解决无法编译驱动的问题
驱动开发·visual studio
篮子里的玫瑰4 天前
智能天气时钟项目(二):AHT20温湿度传感器驱动开发详解
驱动开发