扩散模型零样本分类应用笔记

1 Title

Your Diffusion Model is Secretly a Zero-Shot Classifier(Alexander C. Li, Mihir Prabhudesai, Shivam Duggal, Ellis Brown, Deepak Pathak)【ICCV 2023】

2 Conclusion

This paper shows that the density estimates from large-scale text-to-image diffusion models like Stable Diffusion can be leveraged to perform zero-shot classifi-cation without any additional training.

3 Good Sentences

1、Obtaining a diffusion model classifier through Bayes' theorem consists of repeatedly adding noise and computing a Monte Carlo estimate of the expected noise reconstruction losses (also called -prediction loss) for every class. We call this approach Diffusion Classifier.(The theory of this study that use diffusion model to make classification)

2、Discriminative approaches directly learn tomodel the decision boundary of the underlying task, while generative approaches learn to model the distribution of the data and then address the underlying task as a maximum likelihood estimation problem. (The principle of the generate mode that used in discrimination)

3、We split our evaluation into a series of stages, where in each stage we try each remaining ci some number of times and then remove the ones that have the highest average error. This allows us to efficiently eliminate classes that are almost certainly not the final output and allocate more compute to reasonable classes.(The improvement of this study for Efficient Classification)


对于像 Stable Diffusion 这种类型的 diffusion models,主要的步骤有两个,其一是 sampling,其二是 density estimation。而第二点又分为两种,unconditional density estimation 和 conditional density estimation,前者估计,后者估计

本文认为类似stable diffusion这样的大规模text2img模型所计算出的密度估计,可以被用来进行"零样本分类" (zero-shot classification),而不需要额外的训练。 也就是在大规模Text2Img任务中density estimation 这件事情几乎等价于 zero-shot classification without training,于是作者们将这一分类机制单独提炼出来,形成了 Diffusion Classifier 模型,并展示了这一模型有着很强的 multi-modal reasoning 的能力,它可以从含分类的 diffusion models 中提取出标准的分类器。

如何将diffusion model应用到zero-shot classification,具体流程图如上图所示:

对于一个分类模型,给定输入x,模型输出类别的概率向量c,对于这个diffusion model,分类任务就是求解。具体推导过程请看论文,这里不多赘述。

作者对比同为zero-shot classifier的CLIP,zero-shot的能力以及接近了基于renset50的CLIP。但与openCLIP ViT-H/14还有较大差距

相关推荐
山岚的运维笔记4 小时前
SQL Server笔记 -- 第20章:TRY/CATCH
java·数据库·笔记·sql·microsoft·sqlserver
Gain_chance4 小时前
33-学习笔记尚硅谷数仓搭建-DWS层交易域用户粒度订单表分析及设计代码
数据库·数据仓库·hive·笔记·学习·datagrip
承渊政道4 小时前
Linux系统学习【Linux系统的进度条实现、版本控制器git和调试器gdb介绍】
linux·开发语言·笔记·git·学习·gitee
lpfasd1235 小时前
两个美国:精英的知识崇拜与底层的反智驯化
笔记
清水迎朝阳5 小时前
解锁读书新体验--有声小说书屋 本地网站的 标注笔记功能
笔记·电子书·读书·标注·有声小说
驭渊的小故事5 小时前
简单模板笔记
数据结构·笔记·算法
智者知已应修善业7 小时前
【洛谷P9975奶牛被病毒传染最少数量推导,导出多样例】2025-2-26
c语言·c++·经验分享·笔记·算法·推荐算法
Junlan277 小时前
Cursor使用入门及连接服务器方法(更新中)
服务器·人工智能·笔记
risc1234567 小时前
如何认识结构?结构 = 要素 + 关系 + 动态
笔记
風清掦8 小时前
【江科大STM32学习笔记-05】EXTI外部中断11
笔记·stm32·学习