tensile/reference/environment-variables

.. meta::

:description: Tensile 调试与实验特性环境变量,包括 kernel 选择、profiling 与调试信息

:keywords: Tensile, environment variables, debugging, profiling, GEMM, ROCm

.. _environment-variables:


环境变量 (Environment Variables)


本节列出 Tensile 客户端和应用程序可用的环境变量,用于测试、调试及实验功能。

.. list-table::

:header-rows: 1

:widths: 50,50

```

* - **环境变量**

  • **用途与取值说明**

* - | ``TENSILE_DB``

| 启用调试功能,通过位字段组合控制输出信息类型。

  • | 十六进制位字段值:

| ``0x2`` 或 ``0x4``:解决方案选择过程信息

| ``0x8``:硬件选择过程信息

| ``0x10``:Predicate 评估调试信息

| ``0x20``:代码对象库加载状态

| ``0x40``:核函数启动参数与设置

| ``0x80``:分配的张量大小

| ``0x100``:卷积参考计算调试信息

| ``0x200``:详细卷积参考计算

| ``0x1000``:库加载信息 (YAML/MessagePack)

| ``0x4000``:解决方案查找效率

| ``0x8000``:已选择的核函数名称

| ``0x80000``:详细核函数参数 (Matrix Instruction, MacroTile 等)

| ``0xFFFF``:启用所有调试输出

* - | ``TENSILE_DB2``

| 启用扩展调试特性。跳过核函数启动,但继续核函数选择和数据分配。

  • | ``1``:启用扩展调试

| ``2``:禁用扩展调试

* - | ``TENSILE_NAIVE_SEARCH``

| 使用朴素搜索方式匹配核函数,而非优化搜索。

  • | ``1``:启用朴素搜索

| ``2``:禁用朴素搜索

* - | ``TENSILE_TAM_SELECTION_ENABLE``

| 启用 Tile Aware 解决方案选择。

  • | ``1``:启用 Tile Aware 选择

| ``2``:禁用 Tile Aware 选择

* - | ``TENSILE_SOLUTION_INDEX``

| 打印已选择的解决方案索引。

  • | ``1``:启用打印

| ``2``:禁用打印

* - | ``TENSILE_METRIC``

| 覆盖解决方案选择默认距离度量。

  • | "Euclidean":欧几里得距离

| "JSD":Jensen-Shannon 散度

| "Manhattan":曼哈顿距离

| "Ratio":比率度量

| "Random":随机选择

* - | ``TENSILE_PROFILE``

| 启用对使用 @profile 装饰器的函数进行性能分析,生成 .prof 文件。

  • | ``1``、"ON"、"TRUE":启用 profiling

| 其他值:禁用 profiling

```

相关推荐
H Journey4 分钟前
opencv之图像轮廓
人工智能·opencv·计算机视觉
冬至喵喵9 分钟前
提示工程 × 上下文管理:2025-2026 完整技术全景
人工智能·机器学习
孤岛站岗10 分钟前
【AI Agent实战手册】AG13:Agent的边界与风险——自主AI可能带来什么问题
人工智能
人工智能AI技术12 分钟前
飞书版ClaudeCode,比龙虾好用多了
人工智能
大嘴皮猴儿15 分钟前
AI图片翻译技术解析:以跨马翻译为例看电商图片翻译的实际效果
大数据·数据库·人工智能·自动翻译·教育电商
33三 三like15 分钟前
基于GraphSAGE的养老服务知识图谱节点嵌入:从理论到落地实践
人工智能·知识图谱
自然语17 分钟前
人工智能之数字生命 认知架构白皮书 第4章
人工智能·架构
mhkxbq17 分钟前
AI与大数据时代:昆仑G5580、G5680 V2、G2280及泰山200服务器登场
大数据·服务器·人工智能
fpcc37 分钟前
AI和大模型——神经网络
人工智能·深度学习·神经网络
liuniu081838 分钟前
机器学习(常用科学计算库的使用)基础定位和目标
人工智能·机器学习