Improved DDPM

作者:Alex Nichol*, Prafulla Dhariwal*

关键词:diffusion model, fast sampling

论文:Improved Denoising Diffusion Probabilistic Models

知乎:https://zhuanlan.zhihu.com/p/557971459

摘要

去噪扩散概率模型(DDPM)是一类生成模型,最近已被证明能产生良好的样本。我们表明,通过一些简单的修改,DDPM也可以在保持高样本质量的同时实现具有竞争力的对数似然。此外,我们发现,反向扩散过程的学习方差允许以数量级更少的正向传递进行采样,样本质量差异可以忽略,这对于这些模型的实际部署非常重要。我们还使用精度和重新调用来比较DDPM和GANs覆盖目标分布的程度。最后,我们表明,这些模型的样本质量和似然性随模型容量和训练计算而平滑扩展,使其易于扩展。

贡献

  • 噪声机制更新,使用cosine
  • 引入了方差项的学习

方差学习

faster sampling

DDPM是一步一步的往上采样,这里有一个strided sampling schedule,也就是每次网上采样100步,参数都没变化。

Paper List

  1. (DDPM) Denoising Diffusion Probabilistic Models. NIPS 20. (Diffusion and deep-learning-based 图像生成开山之作)
  2. More Control for Free! Image Synthesis with Semantic Diffusion Guidance. arXiv 21. (对DDIM进行了推广,引入了一般形式的判别器引导)
  3. Denoising Diffusion Implicit Models. ICLR 21. (提出了一种新的sampling的方法,可以通过改变eta来skip一些step,进而达到加速sampling的目的)
  4. Improved denoising diffusion probabilistic models. ICML 21.
  5. Classifier-Free Diffusion Guidance. NIPSW 21. (引入了等价结构替代了分类器引导)
  6. GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models. ICML 22.
  7. Hierarchical Text-Conditional Image Generation with CLIP Latents. NIPS 22 在投. (DALL-E 2)
  8. Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding. NIPS 22 在投. (Imagen, SOTA)
  9. High-Resolution Image Synthesis with Latent Diffusion Models. CVPR 22. (隐空间LDM)

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注