当前位置:网站首页>005_SS_ Palette Image-to-Image Diffusion Models
005_SS_ Palette Image-to-Image Diffusion Models
2022-07-21 05:12:00 【Artificial Idiots】
Palette: Image-to-Image Diffusion Models
本文是Conditional Diffusion的应用, 作者提出了基于Conditional Diffusion的 Image-to-Image新的baseline. 本文偏向于应用, 在理论上的创新性并不大.
1. Introduction
本文作者的工作主要有三个部分:
- 提出了基于Conditional Diffusion的Image-to-Image baseline
- 探究了训练Diffusion时, L1和L2损失, 以及self-attention层的作用
- 在四个任务, Colorization, Inpainting, Uncropping, JPEG decompression测试了新的baseline, 并使用了Frechet Inception Distance(FID), Inception Score(IS), Classification Accuracy(CA) of a pretrained ResNet-50 classifier, Perceptual Distance(PD) 四个指标来评测模型性能.
2. Conditional Diffusion
本文在理论方面并没有多少创新性, 做法也比较简单. Diffusion模型中的Unet输入是第t步的结果和对应步的噪声参数, 而Conditional Diffusion只是在输入中加入了条件信息x, 而处理的方法就是将加入的条件x与原来的输入concatenate起来.
而损失函数形式与Diffusion唯一的区别就在于输入多了个条件信息x.
作者做出的改进主要是对DDPM的Unet做了改进, 这个部分本文没有给出源码, 具体做了什么不甚了解.
3. 实验结果
作者在四个任务上测试了四种指标, 详细实验内容请参考原文.
值得一提的是, 作者测试了L1和L2损失对实验结果的影响.
得出的结论是: L1和L2损失得到结果的采样质量相似, 但是L2得到的结果会有更高的多样性, 而L1损失的结果则相对保守.
这里有一个实验细节, 也就是说作者在训练时, 前向过程的一系列噪声参数用的是(1e-6, 0.01) 2000步, 而采样过程则用的是(1e-4, 0.09) 1000步. 这个细节可以看出, 训练和采样可以有不同的步数, 不同的参数, 这是个之前没见过的发现.
边栏推荐
- Android AlarmManage+BroadcastReceiver+Service通知栏实现推送(后台被清也能实现)Kotlin
- Wonderful journey of quantum mechanics - pre preparation
- Actual combat of fluent mediaquery
- Source code reading
- Understand the problem of static library / dynamic library link in one article
- Flutter2的新功能
- Why does the ViewModel still exist after the activities are rebuilt—— Jetpack series
- Invalid bound statement (not found): com. example. demo1.mapper. UserMapper. XXX
- 量子测量 量子计算 量子通讯 概述
- 基于EasyCV复现DETR和DAB-DETR,Object Query的正确打开方式
猜你喜欢
數據存儲方案(二)-SQLite數據庫存儲
Lifecycle: the foundation of lifecycle aware components - jetpack series (1)
Resolution: failed to connect the pipeline to the virtual machine: all pipeline instances are in use
【使用Kotlin编写您编写的第一个程序】
Configure alarm messages for SQL Server
Camera2 flash combing
Camera摄像头工作原理
Impala-shell exports the more than 9 million level table on kudu (below)_ Complete transmission
基于EasyCV复现ViTDet:单层特征超越FPN
阿里超大规模 Flink 集群运维实践
随机推荐
Data storage scheme (I) - file storage and SharedPreferences storage
Camera2 閃光燈梳理
For sensors and ISPs, precautions for crop and downscale of output images
數據存儲方案(二)-SQLite數據庫存儲
Invalid bound statement (not found): com.example.demo1.mapper.UserMapper.XXX
Vi/vim basic commands
Output file is empty, nothing was encoded (check -ss / -t / -frames parameters if used) solution
Power integrity from an AC Perspective
生物JC 磷酸化蛋白组分析解释了CDKs在TNF信号通路中的关键作用
[wechat applet learning notes] two positions of pop-up window
Partition tables in azure synapse Analytics (dedicated SQL pool)
吴恩达机器学习系列课程汇总(视频+部分汉化+讲义+作业)
Take you to customize the gradle plug-in by hand - gradle series (2)
How to judge code quality
Getting started with kotlin
Mqtt (mosquitto) basic configuration
Manually build APK process
A little friend said he couldn't understand livedata, flow and channel. Come with me
Sketch map of shutter curves animation curve
PostgreSQL executes the query statement with an error: relation "table_xxx" does not exist