tensorflow tf.function 的两种执行模式（计算图执行 vs Eager 执行）的关键差异

这段内容的核心是讲解 tf.function 的两种执行模式（计算图执行 vs Eager执行）的关键差异 ，以及实践中容易踩的坑（比如 print 只执行一次），最终给出解决方案。核心目标是帮你理解：为什么用 tf.function 后，Python 原生语句的行为会和预期不一样？底层逻辑是什么？

我们用「通俗比喻+步骤拆解」的方式，结合已学的计算图知识（跟踪=构建图、复用图），把每个点讲透：

一、先明确核心前提（衔接之前的知识）

tf.function 的默认执行模式 ：计算图执行（之前讲的"构建图→优化图→执行图"），核心是「一次跟踪（构建图），多次复用图」；
Eager执行模式：「每次调用都逐行执行 Python 代码+TensorFlow 运算」，和普通 Python 函数行为一致；
切换开关 ：tf.config.run_functions_eagerly(True) 可以全局关闭图执行，强制所有 tf.function 用 Eager 模式执行（用完要切回 False）。

二、第一部分：MSE 例子------两种模式"结果一致"

这部分是铺垫，证明 tf.function 不会改变计算逻辑，只是执行方式不同：

python 复制代码

@tf.function
def get_MSE(y_true, y_pred):
  sq_diff = tf.pow(y_true - y_pred, 2)  # TensorFlow运算（会被图捕获）
  return tf.reduce_mean(sq_diff)        # TensorFlow运算（会被图捕获）

图执行（默认） ：第一次调用时，tf.function 会"跟踪"函数，把 tf.pow、tf.reduce_mean 这些 TensorFlow 运算捕获到计算图里，后续调用直接复用图，计算结果和 Eager 执行完全一致（都是 8）；
Eager执行（强制开启） ：每次调用都逐行执行 tf.pow 和 tf.reduce_mean，结果同样是 8。

这部分的目的是：让你放心，tf.function 不会改你的计算逻辑，只是执行方式不同。

三、核心反例：`print` 语句------两种模式"行为迥异"

这是这段内容的重点！通过 print 揭示两种模式的关键差异，先看现象，再拆原因：

1. 图执行模式（默认）：调用3次，`print` 只执行1次

python 复制代码

@tf.function
def get_MSE(y_true, y_pred):
  print("Calculating MSE!")  # Python原生语句（不会被图捕获）
  sq_diff = tf.pow(y_true - y_pred, 2)
  return tf.reduce_mean(sq_diff)

# 调用3次
error = get_MSE(y_true, y_pred)
error = get_MSE(y_true, y_pred)
error = get_MSE(y_true, y_pred)

# 输出：只打印1次 "Calculating MSE!"

2. Eager执行模式（强制开启）：调用3次，`print` 执行3次

python 复制代码

tf.config.run_functions_eagerly(True)
error = get_MSE(y_true, y_pred)
error = get_MSE(y_true, y_pred)
error = get_MSE(y_true, y_pred)

# 输出：3次 "Calculating MSE!"
tf.config.run_functions_eagerly(False)

3. 关键解释："跟踪（Tracing）"是什么？为什么 `print` 只执行1次？

这是理解差异的核心，结合之前的计算图知识：

跟踪（Tracing） ：就是 tf.function 第一次调用时，「扫描函数、收集 TensorFlow 运算、构建计算图」的过程（之前讲的"构建图"步骤）；
跟踪阶段的行为 ：
1. 此时会执行一遍 Python 原生代码 （比如 print），目的是找出函数里的 TensorFlow 运算（tf.pow、tf.reduce_mean）；
2. 只把「TensorFlow 运算」捕获到计算图里，Python 原生语句（print、for循环、if的Python判断等）不会被纳入计算图；
后续调用的行为 ：
1. 不再执行 Python 原生代码，直接复用之前构建好的计算图；
2. 所以 print 只在"跟踪阶段"执行1次，后续3次调用都只跑图里的 TensorFlow 运算，不触发 print。

用比喻理解：

图执行：把函数当成"剧本"，第一次调用是"拍电影"（跟踪）------导演（tf.function）跑一遍剧本，把"演戏动作"（TensorFlow运算）拍进电影（计算图），而"剧本上的旁白"（print）只念一次；后续调用是"放映电影"（复用图），只播放拍好的戏，不会再念旁白；
Eager执行：每次调用都是"现场直播"（逐行执行Python代码），既要演戏（TensorFlow运算），也要念旁白（print），所以每次都有输出。

四、解决方案：想在图执行中每次都打印？用 `tf.print`

因为 print 是 Python 原生语句，不会被计算图捕获；而 tf.print 是 TensorFlow 原生运算，会被纳入计算图，每次执行图都会调用它：

python 复制代码

@tf.function
def get_MSE(y_true, y_pred):
  tf.print("Calculating MSE!")  # TensorFlow运算，会被图捕获
  sq_diff = tf.pow(y_true - y_pred, 2)
  return tf.reduce_mean(sq_diff)

# 调用3次
error = get_MSE(y_true, y_pred)
error = get_MSE(y_true, y_pred)
error = get_MSE(y_true, y_pred)

# 输出：3次 "Calculating MSE!"

五、总结：这段内容到底在讲什么？

核心是提醒你使用 tf.function 时的一个关键"坑"------计算图执行和 Eager 执行的行为差异，根源在"跟踪阶段"和"复用图阶段"的分离：

tf.function 默认是「图执行」：Python 原生语句（print、普通if/for）只在第一次"跟踪"时执行1次，TensorFlow 运算会被纳入图，后续复用图时只执行这些运算；
Eager 执行（强制开启）：每次调用都逐行执行 Python 代码，所有语句（包括print）都会执行；
实践建议：如果需要在图执行中保留"每次都执行"的副作用（比如打印、日志），要用 TensorFlow 原生工具（tf.print），而非 Python 原生语句。

简单说：用 tf.function 时，要区分"Python 原生代码"和"TensorFlow 运算"------前者只在跟踪时跑一次，后者会被图捕获，每次执行都跑。这是实践中避免 bug 的关键。

tensorflow tf.function 的两种执行模式（计算图执行 vs Eager 执行）的关键差异

一、先明确核心前提（衔接之前的知识）

二、第一部分：MSE 例子------两种模式"结果一致"

三、核心反例：print 语句------两种模式"行为迥异"

1. 图执行模式（默认）：调用3次，print 只执行1次

2. Eager执行模式（强制开启）：调用3次，print 执行3次

3. 关键解释："跟踪（Tracing）"是什么？为什么 print 只执行1次？

四、解决方案：想在图执行中每次都打印？用 tf.print

五、总结：这段内容到底在讲什么？

三、核心反例：`print` 语句------两种模式"行为迥异"

1. 图执行模式（默认）：调用3次，`print` 只执行1次

2. Eager执行模式（强制开启）：调用3次，`print` 执行3次

3. 关键解释："跟踪（Tracing）"是什么？为什么 `print` 只执行1次？

四、解决方案：想在图执行中每次都打印？用 `tf.print`