在 TensorFlow 1.x 版本中,有三种常用的模型保存方式:Checkpoints,tf.saved_model
(SavedModel 格式),以及 Freeze Graph。以下是每种方式的简要说明、优缺点。
- Checkpoints
Checkpoints 是 TensorFlow 中比较早期的模型保存方式。它通过 tf.train.Saver()
实例保存和恢复模型的参数(权重和偏置)。
优点:
- 简单易用,只需创建
tf.train.Saver()
实例并调用save
和restore
方法。 - 保存空间相对较小,只保存参数值。
缺点:
- 只保存模型的参数值(variables),不保存计算图结构,因此在恢复时,需要先重新定义模型结构。
- 依赖于原始的 Python 代码来重新构建计算图。
- 不方便跨语言或平台部署,因为缺乏计算图的描述。
tf.saved_model
(SavedModel 格式)
SavedModel 格式是 TensorFlow 更推荐的模型保存格式。它是一个包含完整的 TensorFlow 程序的目录,包括权重和图结构。
优点:
- 完整保存富集成的模型,包括计算图和参数值。
- 可跨平台部署,适合在 TensorFlow Serving、TensorFlow Lite、TensorFlow.js 或 TensorFlow Hub 上使用。
- 支持模型的版本管理。
缺点:
- 文件较大,因为包含了完整的图结构和参数值。
- 可能需要更复杂的代码来保存和恢复。
- Freeze Graph
Freeze Graph 是将 TensorFlow 计算图和参数冻结为一个单一文件的过程。这通过将 GraphDef
和 Checkpoints 文件合并,并转换成常量,来创建一个不可变的 GraphDef
文件。
优点:
- 产生一个全部操作都转换成常量的不变计算图,适合性能优化和模型部署。
- 文件大小减少,因为所有变量被转化为常量,移动了不必要的元数据和操作。
缺点:
- 在冻结过程中,可能会丢失图结构中的一些信息,这可能影响之后对模型的微调和维护。
- 一旦冻结,图内的节点不可更改,这意味着不能对模型的结构进行调整。
- 工具链比较复杂,通常需要通过
tf.graph_util.convert_variables_to_constants
函数来完成。
总的来说,每种保存方法都适用于不同的场景。如果你需要不断迭代模型并将结果保存为 Checkpoints,则 Checkpoints 是个好选项;如果你打算在不同的平台上部署模型,则推荐使用 SavedModel 格式;如果你要将模型部署到生产环境中,并希望文件尽可能小,则可能需要使用 Freeze Graph 来冻结模型。在 TensorFlow 2.x 中,官方强烈推荐使用 SavedModel 格式,因为它的API设计更加统一、简洁。