- Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network
- 使用生成对抗网络的逼真单图像超分辨率
- 一作:Christian Ledig
- 是Twitter2017年的一篇论文。
Method (估计生成网络的参数)
符号含义:
用mini-batch的方式来估计生成网络的参数:
θ
^
G
=
a
r
g
?
m
i
n
θ
G
1
N
∑
n
=
1
N
l
S
R
(
G
θ
G
(
I
n
L
R
)
,
I
n
H
R
)
(
1
)
\widehat{θ}_{G} = arg\,\underset{θ_G}{min} \frac{1}{N}\sum_{n=1}^{N}l^{SR}(G_{θ_G}(I^{LR}_n), I^{HR}_n) \qquad\qquad\qquad(1)
θ
G?=argθG?min?N1?n=1∑N?lSR(GθG??(InLR?),InHR?)(1)
`允许人们训练生成模型G,其目标是欺骗可微的鉴别器D,该鉴别器D被训练来区分超分辨率图像和真实图像。通过这种方法,生成器G可以学习创建与真实图像高度相似的解决方案。
符号含义:
判别器网络 D θ D D_{θ_D} DθD??以交替的方式与生成器网络 G θ G G_{θ_G} GθG??一起优化,来解决对抗性最小-最大问题:
m i n θ G ? m a x θ D E I H R ~ p t r a i n ( I H R ) [ l o g D θ D ( I H R ) ] + E I L R ~ p G ( I L R ) [ l o g ( 1 ? D θ D ( G θ G ( I L R ) ) ) ] ( 2 ) \underset{θ_G}{min}\,\underset{θ_D}{max}\quad\mathbb{E}_{I^{HR}~p_{train}(I^{HR})}[logD_{θ_D}(I^{HR})] + \mathbb{E}_{I^{LR}~p_G(I^{LR})}[log(1 - D_{θ_D}(G_{θ_G}(I^{LR})))]\qquad(2) θG?min?θD?max?EIHR~ptrain?(IHR)?[logDθD??(IHR)]+EILR~pG?(ILR)?[log(1?DθD??(GθG??(ILR)))](2)
前一项 — E I H R ~ p t r a i n ( I H R ) [ l o g D θ D ( I H R ) ] \mathbb{E}_{I^{HR}~p_{train}(I^{HR})}[logD_{θ_D}(I^{HR})] EIHR~ptrain?(IHR)?[logDθD??(IHR)]:
后一项 — E I L R ~ p G ( I L R ) [ l o g ( 1 ? D θ D ( G θ G ( I L R ) ) ) ] \mathbb{E}_{I^{LR}~p_G(I^{LR})}[log(1 - D_{θ_D}(G_{θ_G}(I^{LR})))] EILR~pG?(ILR)?[log(1?DθD??(GθG??(ILR)))]:
所以:
从上图来看:
从上图来看:
由公式1可知,感知损失函数 l S R l^{SR} lSR对于生成器网络的性能至关重要。
MSE loss 公式如下:
I
X
S
R
=
l
M
S
E
S
R
=
1
r
2
W
H
∑
x
=
1
r
W
∑
y
=
1
r
H
(
I
x
,
y
H
R
?
G
θ
G
(
I
L
R
)
x
,
y
)
2
(
4
)
I^{SR}_{X}=l_{MSE}^{SR} = \frac{1}{r^2WH}\sum^{rW}_{x=1}\sum^{rH}_{y=1}(I^{HR}_{x,y} - G_{θ_G}(I^{LR})_{x,y})^2\quad\quad\quad (4)
IXSR?=lMSESR?=r2WH1?x=1∑rW?y=1∑rH?(Ix,yHR??GθG??(ILR)x,y?)2(4)
符号含义:
VGG损失为重建图像
G
θ
G
(
I
L
R
)
G_{θ_G}(I^{LR})
GθG??(ILR) 特征表示和参考图像
I
H
R
I^{HR}
IHR 的欧几里得距离(the eculidean distance) :
I
X
S
R
=
l
V
G
G
/
i
,
j
S
R
=
1
W
i
,
j
H
i
,
j
∑
x
=
1
W
i
,
j
∑
y
=
1
H
i
,
j
(
?
i
,
j
(
I
H
R
)
x
,
y
?
?
i
,
j
(
G
θ
G
(
I
L
R
)
)
x
,
y
)
2
I^{SR}_{X}=l^{SR}_{VGG/i,j} = \frac{1}{W_{i,j}H_{i,j}}\sum^{W_{i,j}}_{x=1}\sum^{H_{i,j}}_{y=1}(\phi_{i,j}(I^{HR})_{x,y} - \phi_{i,j}(G_{θ_G}(I^{LR}))_{x,y})^2
IXSR?=lVGG/i,jSR?=Wi,j?Hi,j?1?x=1∑Wi,j??y=1∑Hi,j??(?i,j?(IHR)x,y???i,j?(GθG??(ILR))x,y?)2
l
p
e
r
c
e
p
=
l
V
G
G
/
i
,
j
=
1
W
i
,
j
H
i
,
j
∑
x
=
1
W
i
,
j
∑
y
=
1
H
i
,
j
(
?
i
,
j
(
I
H
R
)
x
,
y
?
?
i
,
j
(
G
θ
G
(
I
L
R
)
)
x
,
y
)
2
l_{percep}=l_{VGG/i,j} = \frac{1}{W_{i,j}H_{i,j}}\sum^{W_{i,j}}_{x=1}\sum^{H_{i,j}}_{y=1}(\phi_{i,j}(I^{HR})_{x,y} - \phi_{i,j}(G_{θ_G}(I^{LR}))_{x,y})^2
lpercep?=lVGG/i,j?=Wi,j?Hi,j?1?x=1∑Wi,j??y=1∑Hi,j??(?i,j?(IHR)x,y???i,j?(GθG??(ILR))x,y?)2
符号含义:
对抗损失函数
l
G
e
n
S
R
l^{SR}_{Gen}
lGenSR?是基于辨别器
D
θ
D
(
G
θ
G
(
I
L
R
)
)
D_{θ_D}(G_{θ_G}(I^{LR}))
DθD??(GθG??(ILR))在所有训练样本上的损失,我们要最小化:
l
G
e
n
S
R
=
∑
n
=
1
N
?
l
o
g
D
θ
D
(
G
θ
G
(
I
L
R
)
)
l^{SR}_{Gen}=\sum^{N}_{n=1}-logD_{θ_D}(G_{θ_G}(I^{LR}))
lGenSR?=n=1∑N??logDθD??(GθG??(ILR))
目的就是要让生成网络的结果产生较高的判别值来骗过判别网络