tensile/reference/environment-variables

.. meta::

:description: Tensile 调试与实验特性环境变量,包括 kernel 选择、profiling 与调试信息

:keywords: Tensile, environment variables, debugging, profiling, GEMM, ROCm

.. _environment-variables:


环境变量 (Environment Variables)


本节列出 Tensile 客户端和应用程序可用的环境变量,用于测试、调试及实验功能。

.. list-table::

:header-rows: 1

:widths: 50,50

```

* - **环境变量**

  • **用途与取值说明**

* - | ``TENSILE_DB``

| 启用调试功能,通过位字段组合控制输出信息类型。

  • | 十六进制位字段值:

| ``0x2`` 或 ``0x4``:解决方案选择过程信息

| ``0x8``:硬件选择过程信息

| ``0x10``:Predicate 评估调试信息

| ``0x20``:代码对象库加载状态

| ``0x40``:核函数启动参数与设置

| ``0x80``:分配的张量大小

| ``0x100``:卷积参考计算调试信息

| ``0x200``:详细卷积参考计算

| ``0x1000``:库加载信息 (YAML/MessagePack)

| ``0x4000``:解决方案查找效率

| ``0x8000``:已选择的核函数名称

| ``0x80000``:详细核函数参数 (Matrix Instruction, MacroTile 等)

| ``0xFFFF``:启用所有调试输出

* - | ``TENSILE_DB2``

| 启用扩展调试特性。跳过核函数启动,但继续核函数选择和数据分配。

  • | ``1``:启用扩展调试

| ``2``:禁用扩展调试

* - | ``TENSILE_NAIVE_SEARCH``

| 使用朴素搜索方式匹配核函数,而非优化搜索。

  • | ``1``:启用朴素搜索

| ``2``:禁用朴素搜索

* - | ``TENSILE_TAM_SELECTION_ENABLE``

| 启用 Tile Aware 解决方案选择。

  • | ``1``:启用 Tile Aware 选择

| ``2``:禁用 Tile Aware 选择

* - | ``TENSILE_SOLUTION_INDEX``

| 打印已选择的解决方案索引。

  • | ``1``:启用打印

| ``2``:禁用打印

* - | ``TENSILE_METRIC``

| 覆盖解决方案选择默认距离度量。

  • | "Euclidean":欧几里得距离

| "JSD":Jensen-Shannon 散度

| "Manhattan":曼哈顿距离

| "Ratio":比率度量

| "Random":随机选择

* - | ``TENSILE_PROFILE``

| 启用对使用 @profile 装饰器的函数进行性能分析,生成 .prof 文件。

  • | ``1``、"ON"、"TRUE":启用 profiling

| 其他值:禁用 profiling

```

相关推荐
luoganttcc5 小时前
自动驾驶 世界模型 有哪些(二)
人工智能·机器学习·自动驾驶
人工智能AI技术5 小时前
315曝光AI投毒!用C#构建GEO污染检测与数据安全防护方案
人工智能·c#
Hamm5 小时前
不想花一分钱玩 OpenClaw?来,一起折腾这个!
javascript·人工智能·agent
乌白云6 小时前
深度学习中的四种归一化方法
深度学习·归一化·批量归一化·层归一化
_李小白6 小时前
【AI大模型学习笔记之平台篇】第二篇:Gemini
人工智能·音视频
一点一木6 小时前
🚀 2026 年 2 月 GitHub 十大热门项目排行榜 🔥
人工智能·github
理性的曜6 小时前
VoloData——基于LangChain的智能数据分析系统
人工智能·vscode·数据分析·npm·reactjs·fastapi·ai应用
flying_13146 小时前
图神经网络分享系列-MPNN(Neural Message Passing for Quantum Chemistry)(二)
人工智能·深度学习·神经网络·图神经网络·消息传递·门控机制·mpnn
HyperAI超神经6 小时前
AI驱动量子精修,卡内基梅隆大学等提出AQuaRef,首次用量子力学约束精修蛋白质全原子模型
人工智能·深度学习·机器学习·架构·机器人·cpu·量子计算
balmtv7 小时前
Grok 3技术深度拆解:20万卡集群、思维链推理与DeepSearch的架构实现
人工智能·架构