技术开发站45793.com
扩散模型:Diffusion Model原理剖析
发布时间:
2024年01月20日
Diffusion Model
视频
Training
第5行是唯一需要解释的地方,
x 0 x_{0}
x
0
?
是干净的图片,
? θ \epsilon _{\theta }
?
θ
?
是前面说的Noise Predictor,它的输入包括加噪声之后的图像(红色框)以及时序
t t
t
,
? \epsilon
?
是训练的target也就是添加的噪声。它其实与前面我们提到的一步步加噪的过程不一样,而是一次就可以了。
Inference
最大似然估计
倒数第二行增加了与θ无关的一项,使得能将式子合并;KL散度,用来衡量两个概率分布之间的差异,KL越大,分布差异越大。
前向加噪推导
以此类推,从
x 0 x_{0}
x
0
?
文章来源:https://blog.csdn.net/u013308709/article/details/135705906
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:chenni525@qq.com进行投诉反馈,一经查实,立即删除!
最新文章
Python教程
深入理解 MySQL 中的 HAVING 关键字和聚合函数
Qt之QChar编码(1)
MyBatis入门基础篇
用Python脚本实现FFmpeg批量转换
看着spring源码,写框架(第1天)
Java 第14章 集合 本章作业
GC8549国产芯片——应用于摄像机、消费类等产品中,双通道 12V,内置过温保护, H 桥电源短接保护,短地保护
Postgresql中自增主键序列的使用以及数据传输时提示:错误:关系“xxx_xx_xx_seq“不存在
Android—— MIPI屏调试
Nginx笔记
Linux xxd命令分析视频文件Box教程(box分析box、视频box、分析atom分析)(xdd指令)
Python中range数列与for循环
NLP深入学习(六):n-gram 语言模型
[C++ 从入门到精通] 18.左值、右值,左值引用、右值引用、move