TwIST算法MALTLAB主程序详解

发布时间:2023年12月25日

TwIST算法MALTLAB主程序详解

关于TwIST算法的具体原理可以参考:
链接: https://ieeexplore.ieee.org/abstract/document/4358846
链接: https://blog.csdn.net/jbb0523/article/details/52193209

该算法的MATLAB源代码:
链接: http://www.lx.it.pt/~bioucas/TwIST/TwIST.htm

1. 函数定义与输入输出变量

主函数的定义如下所示,TwIST包含7个输出变量和若干个输入变量,其中包含3个必需输入变量和若干个可选输入变量(varargin)。具体每个变量的含义可以参考MATLAB TwIST.m文件中的解释。下文仅对一些关键参数进行解释。

function [x,x_debias,objective,times,debias_start,mses,max_svd] = ...
         TwIST(y,A,tau,varargin)

该算法主要解决如下正则化问题:

arg min_x = 0.5*|| y - A x ||_2^2 + tau phi( x )

也就是论文中式(1)所示,注意在MATLAB代码中存在一些符号表示的改变。如K?A,λ?tau等。
在这里插入图片描述

其具体的迭代公式如原论文中式(17)-(19)所示
在这里插入图片描述
从式(17)-(19)中看,我们需要 x 0 , α , β , y , K , Ψ λ x_{0},\alpha,\beta,y,K,\Psi_{\lambda} x0?,α,β,y,K,Ψλ?等一系列参数,上述迭代公式方可正确运行。针对算法,输出变量中x即为目标的估计值,x_debias为目标估计值的去偏结果,获得这一结果往往需要在主循环迭代结束后,通过适当的去偏迭代,消除正则化器造成的一些偏差。

输入变量含义
y测量结果,可以为1为向量或者二维数组
A对应原论文中的K
tau正则化参数,对应原论文中的λ
Psi去噪函数句柄,对应原论文中的去噪函数ψ
Phi正则化器的函数句柄,对应原论文中的Φ
lambdaTwIST算法的lam1参数,对应原论文中的 λ 1 \lambda_{1} λ1?参数,论文中的 λ N \lambda_{N} λN?在程序中被设置为常数1
alphaTwIST的alpha参数 (详见论文式 (22))
betaTwIST的beta参数 (详见论文式 (23))

2.算法主要步骤

TwIST.m的代码很长,但主要包含的内容并不多。下文主要对在代码中关键部分进行解释。按照从前往后的顺序,主要包含了以下几个内容:

(1)变量注释。

这一部分对函数的每一个变量都进行了注释,包括必须变量和可选变量。建议按照以上迭代公式了解关键参数的含义。

(2)变量设定。

这一部分主要在变量注释和初始化两部分之间。
主要定义了

  • 各个变量的默认值。
  • 使用一个switch-case分支语句读取varargin所代表的可选输入参数,实现可选变量的自定义功能。
  • 对主要变量,如alpha和beta进行设定。对于这个部分,多说一点。如原论文中所示

在这里插入图片描述
在这里插入图片描述

实际上存在如下关系:

0 < ξ 1 ≤ λ 1 < λ N ≤ ξ m , ξ  ̄ m ≡ m a x ( 1 , ξ m ) 0< \xi_{1} ≤ \lambda_{1} < \lambda_{N} ≤ \xi_{m} , \overline{\xi}_{m}≡max(1,\xi_{m}) 0<ξ1?λ1?<λN?ξm?,ξ?m?max(1,ξm?)
而在程序中,作者直接用 λ 1 \lambda_{1} λ1?表示了 ξ 1 \xi_{1} ξ1?,同时设定 ξ m \xi_{m} ξm? λ N = 1 \lambda_{N}=1 λN?=1。虽然可能有点误差,不过我觉得无可厚非。

关于函数句柄,需要注意的是x在这里并不是只迭代的解x,而是一个指代未知变量的参数,如下面的AT(y)中的y。

if ~isa(A, 'function_handle')
   AT = @(x) A'*x;
   A = @(x) A*x;
end

Aty = AT(y);

(3)初始化。

初始化主要实现了 x 0 x_{0} x0?的设置方法,验证了phi(x)和psi(x)函数是否有效,以及其他一些变量的初始设置。

(4)TwIST主循环迭代。

这一部分是整个代码中最主要的部分。

TwIST算法的迭代包含两个主要部分:TwIST迭代和IST迭代。IST_iters和TwIST_iters的值用于确定当前应该执行哪一种迭代。根据条件判断,当TwIST_iters达到特定阈值或满足特定条件时,会切换到执行IST迭代,而不是继续TwIST迭代;反之亦然。

这一部分主要包含2个while循环,两个while循环会一直运行,直到满足对应条件。

在第二个while循环中有一个 if-else结构,用于判断进行何种操作。在TwIST循环中,IST_iters和TwIST_iters并不会一直增加,而只是一个判断flag,结合对应的if else,完成判断。迭代次数的增加实际上由iter控制。

建议在主循环设置断点,并将IST_iters和TwIST_iters后边的分号去掉,使用demo进行调试。观察IST_iters和TwIST_iters的值变化。这样,IST_iters和TwIST_iters取什么值执行什么语句就一清二楚了。

去噪函数的作用

此外,在主循环中,还有一行比较重要。它解决了这样一个问题:原论文中的迭代公式中并没有psi去噪函数这样一个变量,那它在程序中到底起到了什么作用呢?

x = psi_function(xm1 + grad/max_svd,tau/max_svd);

代码中其他位置的psi_function只是传参或者验证,而该位置的psi_function是起到了实质作用的。psi_function主要用于执行阈值或收缩操作,通常涉及对给定向量或信号进行阈值处理。它可能采用软阈值(soft thresholding)或硬阈值(hard thresholding)等技术,用于将信号的幅度调整为零或接近零,从而产生更稀疏的表示。

稀疏性操作

            if sparse
                mask = (x ~= 0);
                xm1 = xm1.* mask;
                xm2 = xm2.* mask;
            end

以上代码是处理稀疏性的操作。当 sparse 变量为真时(即 sparse 变量为非零值),代码会执行以下操作:

  • 首先,创建一个逻辑掩码 mask,该掩码用于标识变量 x 中非零元素的位置。也就是说,mask 的元素为 1 表示对应 x 中的元素不为零,为 0 表示对应 x 中的元素为零。
  • 然后,通过将 xm1 和 xm2 分别与 mask 相乘,将 xm1 和 xm2 中对应于 x 中零元素位置的部分置为零。
  • 这样可以确保在算法的迭代过程中,对 x 的更新仅在非零位置进行,以保持其稀疏性。

(5)去偏。

在主循环之后,还有一个去偏阶段(debias phase)。这是一个可选操作,作者给出的解释是 :

If the ‘Debias’ option is set to 1, we try to remove the bias from the l1 penalty, by applying CG to the least-squares problem obtained by omitting the l1 term and fixing the zero coefficients at zero.

可见,这一部分主要是为了消除l1惩罚的偏差。

文章来源:https://blog.csdn.net/Carifee/article/details/135178914
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。