扩散模型学习

m0_608570982024-09-30 2:09

先验概率和后验概率是贝叶斯统计学中的两个重要概念，用于描述事件发生的概率在更新观测数据后的变化情况。

先验概率（Prior Probability）：
- 先验概率是在考虑任何观测数据之前，对事件概率的初始估计或信念。
- 它基于以往的知识、经验或主观判断，反映了在考虑新证据之前对事件概率的预期。
- 先验概率通常用P(A)表示，其中A是某个事件。
后验概率（Posterior Probability）：
- 后验概率是在考虑了新的观测数据或证据之后，对事件概率进行更新后得到的概率。
- 它结合了先验概率和新的数据，通过贝叶斯定理计算得出。
- 后验概率通常用P(A|B)表示，其中A是事件，B是观测数据或证据。

The future is independent of the past given the present
未来独立于过去，只基于当下。

这句人生哲理的话也代表了马尔科夫链的思想：过去所有的信息都已经被保存到了现在的状态，基于现在就可以预测未来。

虽然这么说可能有些极端，但是却可以大大简化模型的复杂度，因此马尔可夫链在很多时间序列模型

中得到广泛的应用，比如循环神经网络 RNN，隐式马尔可夫模型 HMM 等，当然 MCMC 也需要它。

DiT的定义：Diffusion Transformer是一种结合了Transformer架构的扩散模型，用于图像和视频生成任务，能够高效地捕获数据中的依赖关系并生成高质量的结果。

DiT的核心思想：Diffusion Transformer的核心思想是使用Transformer作为扩散模型的骨干网络，而不是传统的卷积神经网络(如U-Net)，以处理图像的潜在表示。