diffusion model(十八)：diffusion model中negative prompt的工作机制

type

status

date

slug

summary

引言

在用Stable Diffusion生成图片时，除了输入图片表述文本外（positive prompt），我们还经常会使用negative prompt作为condition来让模型避免生成negative prompt所表述的概念。查阅源码发现stable diffusion中negative prompt的实现机制是将classifier-free guided中替换为，（表示negative prompt）。即：

原生classifier-free guided每一个timestep的噪声估计如下：

当有negative prompt condition时，将上式改为

源码位置位于(diffuser版本v0.29.1): https://github.com/huggingface/diffusers/blob/main/src/diffusers/pipelines/stable_diffusion/pipeline_stable_diffusion.py#L427

那么为什么negative prompt能够work呢？

How do negative prompt take effect

为了引出相关推导，先快速回顾一下classifier-guided和classifier-free的motivation。

为了做条件生成（即从条件分布中采样样本），我们可以根据贝叶斯公式进行如下推导：

在classifier-guided任务中，我们已知无条件输入的score based model能够估计出，因此，为了得到，我们只需额外训练一个分类器来估计即可。为了控制condition的强度，引入一个guidance scale 。

对于classifier-free任务中，通过随机drop标签，我们同时训练和两个score based model。虽然我们可以通过直接进行条件生成，但为了控制生成时条件的强度，沿用了公式(4) guidance scale的概念。并且，故有：

stable diffusion代码路径：https://github.com/huggingface/diffusers/blob/main/src/diffusers/pipelines/stable_diffusion/pipeline_stable_diffusion.py#L1019

当有negative prompt作为condition时，此时的condition为两项，一项是: positive prompt condition，另一项为：negative prompt condition。

只要得到我们就可以参考之前的采样算法生成样本。重新直接训练一个score based model来估计当然可行，但成本巨大。下面来看如何进行简化[1,2]

由于：

记为positive prompt condition的guidance scale,为negative prompt的guidance scale，有

通过式(8)可以得出，我们只需计算，，三项即可估计出。

当时，有

式(9) 就是stable diffusion源码中实现形式

源码位置位于(diffuser版本v0.29.1): https://github.com/huggingface/diffusers/blob/main/src/diffusers/pipelines/stable_diffusion/pipeline_stable_diffusion.py#L427

文献[3]通过“Neutralization Hypothesis”，“Reverse Activation”解释negative prompt conditioning的工作机制，感兴趣的同学可以后续阅读。

When do negative prompt take effect

定性分析

上文我们通过理论推导证明了negative prompt conditioning的可行性。本节将从可视化的角度分析negative prompt conditioning是如何影响图片生成的。主要文献参考[3]

类似Prompt-to-prompt[4]的研究思路，我们可以绘制不同时间步token-wise attention map热力图。从图中发现，negative prompt作用存在一定延迟。positive prompt conditioning在生成的早期（t=0-3）时就关注到对应的区域，而negative prompt conditioning直到t=8-11才能正确关注到对应的区域。