Paper:MHF-Net: An Interpretable Deep Network for Multispectral and Hyperspectral Image Fusion
Code:MHF-net: tpami,cvpr
? 在光谱融合超分的领域中,现有传统方法极大依赖于手工先验知识,造成大量的主观性问题,而基于深度学习的方法,只是利用了通用图像超分的框架进行的处理,不具有很好的可解释性。
? 基于此,本论文从融合模型下手,通过将模型使用神经网络进行优化求解,让提出的MHF-net的每个模块都具有其自己的物理意义。在网络架构基础上,还针对训练数据和测试数据响应矩阵不匹配的问题进行了单独设计。
即使已知R,C从退化的数据立方体转为三维数据立方体是ill-posed问题(不存在唯一解的问题)
缺乏可解释性、偏离先验配置:
充分考虑MS/HS融合的内在生成机制的DL方法,使用Y的完整基集进行计算,网络所有模块都具有可解释性
考虑了训练和测试阶段响应不同的问题,将响应也作为网络输入进行模型的训练
Z = C ( Y A + Y ^ B ) + N Z=C(YA+\hat{Y}B)+N Z=C(YA+Y^B)+N
设计优化问题:
min
?
Y
^
∥
C
(
Y
A
+
Y
^
B
)
?
Z
∥
F
2
+
λ
f
(
Y
^
)
,
\min_{\hat{\boldsymbol{Y}}}\left\|C\left(YA+\hat{Y}B\right)-Z\right\|_F^2+\lambda f\left(\hat{\boldsymbol{Y}}\right),
Y^min?
?C(YA+Y^B)?Z
?F2?+λf(Y^),
采用proximal gradient algorithm进行参数更新
其中
Q
(
Y
^
,
Y
^
(
k
)
)
Q(\hat{Y},\hat{Y}^{(k)})
Q(Y^,Y^(k))是二阶近似:
f
(
x
)
≈
f
(
x
0
)
+
f
′
(
x
0
)
(
x
?
x
0
)
+
f
′
′
(
x
0
)
(
x
?
x
0
)
2
2
f(x)\approx f(x_0)+f^{\prime}(x_0)(x-x_0)+f^{\prime\prime}(x_0)\frac{(x-x_0)^2}2
f(x)≈f(x0?)+f′(x0?)(x?x0?)+f′′(x0?)2(x?x0?)2?
Q
(
Y
^
,
Y
^
(
k
)
)
=
g
(
Y
^
(
k
)
)
+
<
Y
^
?
Y
^
(
k
)
,
?
g
(
Y
^
(
k
)
)
>
+
1
2
η
∥
Y
^
?
Y
^
(
k
)
∥
F
2
+
λ
f
(
Y
^
)
,
\begin{aligned} Q\left(\hat{\boldsymbol{Y}},\hat{\boldsymbol{Y}}^{(k)}\right)& =g\left(\hat{\boldsymbol{Y}}^{(k)}\right)+\left<\hat{\boldsymbol{Y}}-\hat{\boldsymbol{Y}}^{(k)},\nabla g\left(\hat{\boldsymbol{Y}}^{(k)}\right)\right> \\ &+\frac1{2\eta}\left\|\hat{Y}-\hat{Y}^{(k)}\right\|_{F}^{2}+\lambda f\left(\hat{Y}\right), \\ \end{aligned}
Q(Y^,Y^(k))?=g(Y^(k))+?Y^?Y^(k),?g(Y^(k))?+2η1?
?Y^?Y^(k)
?F2?+λf(Y^),?
其中
g
(
Y
^
(
k
)
)
=
∥
C
(
Y
A
+
Y
^
(
k
)
B
)
?
Z
∥
F
2
g(\hat{Y}^{(k)})=\|C(YA+\hat{Y}^{(k)}B)-Z\|_{F}^{2}
g(Y^(k))=∥C(YA+Y^(k)B)?Z∥F2?同时
η
\eta
η作为步长的角色
A Fast Iterative Shrinkage-Thresholding Algorithm for Linear Inverse Problems
根据上图,将优化问题转化为:
min
?
Y
^
1
2
∥
Y
^
?
(
Y
^
(
k
)
?
η
?
g
(
Y
^
(
k
)
)
)
∥
F
2
+
λ
η
f
(
Y
^
)
.
\min_{\hat{\boldsymbol{Y}}}\frac{1}{2}\left\|\hat{\boldsymbol{Y}}-\left(\hat{\boldsymbol{Y}}^{(k)}-\eta\nabla g\left(\hat{\boldsymbol{Y}}^{(k)}\right)\right)\right\|_{F}^{2}+\lambda\eta f\left(\hat{\boldsymbol{Y}}\right).
Y^min?21?
?Y^?(Y^(k)?η?g(Y^(k)))
?F2?+ληf(Y^).
同时,其通解写为:
Y
^
k
+
1
=
p
r
o
x
λ
η
(
Y
^
(
k
)
?
η
?
g
(
Y
^
(
k
)
)
)
\hat{Y}^{k+1}=prox_{\lambda\eta}(\hat{\boldsymbol{Y}}^{(k)}-\eta\nabla g(\hat{\boldsymbol{Y}}^{(k)}))
Y^k+1=proxλη?(Y^(k)?η?g(Y^(k)))
又因为
?
g
(
Y
^
(
k
)
)
=
C
T
[
C
(
Y
A
+
Y
(
k
)
B
?
Z
]
B
T
\nabla g(\hat{Y}^{(k)})=C^{T}\left[C\left(Y A+Y^{(k)}B-Z\right] B^{T}\right.
?g(Y^(k))=CT[C(YA+Y(k)B?Z]BT
就可以将prox函数式子转为:
Y
^
k
+
1
=
p
r
o
x
λ
η
(
Y
^
(
k
)
?
η
C
T
(
C
(
Y
A
+
Y
(
k
)
B
)
?
Z
)
B
T
)
\hat{Y}^{k+1}=prox_{\lambda\eta}\left(\hat{\boldsymbol{Y}}^{(k)}-\eta C^{T}\left(C\left(Y A+Y^{(k)}B\right)-Z\right) B^{T}\right)
Y^k+1=proxλη?(Y^(k)?ηCT(C(YA+Y(k)B)?Z)BT)
A Fast Iterative Shrinkage-Thresholding Algorithm for Linear Inverse Problems
矩阵的 Frobenius 范数及其求偏导法则_f范数求导-CSDN博客
KaTeX parse error: Undefined control sequence: \tr at position 85: …=\operatorname{\?t?r?} \left( \left …
? 由
X
X
X是高分辨率图像,将其变为
E
E
E为低分辨率图像,可以将
C
C
C理解为一个下采样操作,反之
C
T
C^T
CT则为上采样操作,对于
p
r
o
x
λ
η
prox_{\lambda\eta}
proxλη?可以将其看为一个复杂的仿射变换,比作一个神经网络操作。
X
(
k
)
=
Y
A
+
Y
^
(
k
)
B
,
E
(
k
)
=
C
X
(
k
)
?
Z
,
G
(
k
)
=
η
C
T
E
(
k
)
B
T
,
Y
^
(
k
+
1
)
=
p
r
o
x
λ
η
(
Y
^
(
k
)
?
G
(
k
)
)
.
\begin{gathered} X^{(k)}=YA+\hat{Y}^{(k)}B, \\ E^{(k)}=CX^{(k)}-Z, \\ G^{(k)}=\eta C^{T}E^{(k)}B^{T}, \\ \hat{\boldsymbol{Y}}^{(k+1)}=\mathrm{prox}_{\lambda\eta}\left(\hat{\boldsymbol{Y}}^{(k)}-\boldsymbol{G}^{(k)}\right). \end{gathered}
X(k)=YA+Y^(k)B,E(k)=CX(k)?Z,G(k)=ηCTE(k)BT,Y^(k+1)=proxλη?(Y^(k)?G(k)).?
? 将响应矩阵R,C的相关参数也作为模型的输入,其中A,B,C参数都可以从已有训练数据中通过基于模型的方法进行求解估计得到。
? 在训练过程中,对于每个训练样本进行参数估计,将其输入到模型进行训练。在测试阶段,同样是先进行参数估计,再进行输入。通过这种方式,网络有望捕获不同输入光谱和空间响应的一般恢复原理。
? 需要注意的是,此处网络在下采样和上采样过程中,不能简单使用原有的,需要根据求出的参数进行变化。
将优化问题转为神经网络进行求解
[1]W. Dong, P. Wang, W. Yin, G. Shi, F. Wu, and X. Lu, “Denoising Prior Driven Deep Neural Network for Image Restoration,” IEEE Transactions on Pattern Analysis and Machine Intelligence, pp. 2305–2318, Oct. 2019, doi: 10.1109/tpami.2018.2873610.
[1]L. Wang, C. Sun, Y. Fu, M. H. Kim, and H. Huang, “Hyperspectral Image Reconstruction Using a Deep Spatial-Spectral Prior,” in 2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Long Beach, CA, USA, Jun. 2019. doi: 10.1109/cvpr.2019.00822.
[1]D. Yang and J. Sun, “Proximal Dehaze-Net: A Prior Learning-Based Deep Network for Single Image Dehazing,” in Computer Vision – ECCV 2018,Lecture Notes in Computer Science, 2018, pp. 729–746. doi: 10.1007/978-3-030-01234-2_43.
[1]Y. Yang, J. Sun, H. Li, and Z. Xu, “Deep ADMM-Net for compressive sensing MRI,” Neural Information Processing Systems,Neural Information Processing Systems, Dec. 2016.
[1]J. Zhang and B. Ghanem, “ISTA-Net: Interpretable Optimization-Inspired Deep Network for Image Compressive Sensing,” in 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition, Salt Lake City, UT, Jun. 2018. doi: 10.1109/cvpr.2018.00196.
[1]J. Zhang, J. Pan, W.-S. Lai, RynsonW. H. Lau, and M.-H. Yang, “Learning Fully Convolutional Networks for Iterative Non-blind Deconvolution,” Cornell University - arXiv,Cornell University - arXiv, Nov. 2016.