扩散模型学习

先验概率和后验概率是贝叶斯统计学中的两个重要概念,用于描述事件发生的概率在更新观测数据后的变化情况。

  1. 先验概率(Prior Probability)

    • 先验概率是在考虑任何观测数据之前,对事件概率的初始估计或信念。
    • 它基于以往的知识、经验或主观判断,反映了在考虑新证据之前对事件概率的预期。
    • 先验概率通常用P(A)表示,其中A是某个事件。
  2. 后验概率(Posterior Probability)

    • 后验概率是在考虑了新的观测数据或证据之后,对事件概率进行更新后得到的概率。
    • 它结合了先验概率和新的数据,通过贝叶斯定理计算得出。
    • 后验概率通常用P(A|B)表示,其中A是事件,B是观测数据或证据。

https://zhuanlan.zhihu.com/p/38567891#:~:text=%E5%90%8E%E9%AA%8C%E6%A6%82%E7%8E%87%EF%BC%88pos

The future is independent of the past given the present
未来独立于过去,只基于当下。

这句人生哲理的话也代表了马尔科夫链的思想:过去所有的信息都已经被保存到了现在的状态,基于现在就可以预测未来。

虽然这么说可能有些极端,但是却可以大大简化模型的复杂度,因此马尔可夫链在很多时间序列模型

中得到广泛的应用,比如循环神经网络 RNN,隐式马尔可夫模型 HMM 等,当然 MCMC 也需要它。

https://zhuanlan.zhihu.com/p/448575579#:~:text=%E6%9C%AC%E6%96%87%E4%BB%8B%E7%BB%8D%E4%BA%86%E9%A9%AC%E5%B0%94%E5%8F%AF#:~:text=%E6%9C%AC%E6%96%87%E4%BB%8B%E7%BB%8D%E4%BA%86%E9%A9%AC%E5%B0%94%E5%8F%AF

持续火爆!!!《AIGC 面试宝典》已圈粉无数!-CSDN博客

DiT的定义:Diffusion Transformer是一种结合了Transformer架构的扩散模型,用于图像和视频生成任务,能够高效地捕获数据中的依赖关系并生成高质量的结果。

DiT的核心思想:Diffusion Transformer的核心思想是使用Transformer作为扩散模型的骨干网络,而不是传统的卷积神经网络(如U-Net),以处理图像的潜在表示。

相关推荐
m0_650108249 天前
【论文精读】AVID:基于扩散模型的任意长度视频修复
人工智能·扩散模型·论文精读·视频修复·时序一致性·任意时长·结构引导
m0_6501082411 天前
【论文精读】DreamVideo:定制化主体与动作的视频生成技术
扩散模型·论文精读·定制化视频生成·主体学习与动作学习·轻量级适配器·文本引导生成·阿里千问实验室
m0_6501082411 天前
【论文精读】EMO:弱条件下基于 Audio2Video 扩散模型的表情肖像视频生成
aigc·扩散模型·论文精读·音频到视频生成·会说话的头部·弱条件
m0_6501082413 天前
【论文精读】MicroCinema:基于分治策略的文本到视频生成新框架
aigc·扩散模型·论文精读·分治策略·文本到视频生成
m0_6501082413 天前
【论文精读】Snap Video:面向文本到视频生成的规模化时空 Transformer
aigc·扩散模型·论文精读·时空transformer·文本到视频生成·视频生成效率优化
Small___ming14 天前
【论文笔记】扩散模型——如何通俗理解传统概率模型的核心矛盾
论文阅读·人工智能·扩散模型·生成式人工智能
m0_6501082415 天前
【论文精读】TI2V-Zero:零样本图像引导的文本到视频生成技术
计算机视觉·扩散模型·零样本学习·论文精读·文本条件图像到视频生成
m0_6501082420 天前
【论文精读】Animate Anyone:实现角色动画的一致性与可控性图像到视频合成
计算机视觉·扩散模型·论文精读·图像到视频合成·角色动画·姿态引导器·可控生成
m0_6501082420 天前
【论文精读】FDGaussian:基于几何感知扩散模型的单图快速高斯溅射 3D 重建
计算机视觉·扩散模型·论文精读·3d重建·高斯溅射
F_D_Z21 天前
SkyDiffusion:用 BEV 视角打开街景→航拍图像合成新范式
diffusion·sota·1024程序员节·bev·skydiffusion·视角变换·多图融合