TwIST算法MALTLAB主程序详解

关于TwIST算法的具体原理可以参考：

链接: https://ieeexplore.ieee.org/abstract/document/4358846

链接: https://blog.csdn.net/jbb0523/article/details/52193209

该算法的MATLAB源代码：

链接: http://www.lx.it.pt/~bioucas/TwIST/TwIST.htm

1. 函数定义与输入输出变量

主函数的定义如下所示，TwIST包含7个输出变量和若干个输入变量，其中包含3个必需输入变量和若干个可选输入变量(varargin)。具体每个变量的含义可以参考MATLAB TwIST.m文件中的解释。下文仅对一些关键参数进行解释。

复制代码

function [x,x_debias,objective,times,debias_start,mses,max_svd] = ...
         TwIST(y,A,tau,varargin)

该算法主要解决如下正则化问题：

复制代码

arg min_x = 0.5*|| y - A x ||_2^2 + tau phi( x )

也就是论文中式（1）所示，注意在MATLAB代码中存在一些符号表示的改变。如K➡A，λ➡tau等。

其具体的迭代公式如原论文中式（17）-（19）所示

从式（17）-（19）中看，我们需要设置 x 0 , α , β , y , K , Ψ λ x_{0},\alpha,\beta,y,K,\Psi_{\lambda} x0,α,β,y,K,Ψλ等一系列参数，迭代公式方可正确运行。算法的输出变量，x即为目标的估计值，x_debias为目标估计值的去偏结果，获得这一结果往往需要在主循环迭代结束后，通过适当的去偏迭代，消除正则化器造成的一些偏差。

输入变量	含义
y	测量结果，可以为一维向量或者二维数组
A	对应原论文中的K
tau	正则化参数，对应原论文中的λ
Psi	去噪函数句柄，对应原论文中的去噪函数ψ
Phi	正则化器的函数句柄，对应原论文中的Φ
lambda	TwIST算法的lam1参数，对应原论文中的 λ 1 \lambda_{1} λ1参数，论文中的 λ N \lambda_{N} λN在程序中被设置为常数1。若 λ 1 = 1 \lambda_{1}=1 λ1=1，TwIST算法等价于IST算法。
alpha	TwIST的alpha参数 (详见论文式 (22))
beta	TwIST的beta参数 (详见论文式 (23))

2．算法主要步骤

TwIST.m的代码很长，但主要包含的内容并不多。下文主要对在代码中关键部分进行解释。按照从前往后的顺序，主要包含了以下几个内容：

（1）变量注释。

这一部分对函数的每一个变量都进行了注释，包括必须变量和可选变量。建议按照以上迭代公式了解关键参数的含义。

（2）变量设定。

这一部分主要在变量注释和初始化两部分之间。

主要定义了

各个变量的默认值。
使用一个switch-case分支语句读取varargin所代表的可选输入参数，实现可选变量的自定义功能。
对主要变量，如alpha和beta进行设定。对于这个部分，多说一点。如原论文中所示

实际上存在如下关系：

0 < ξ 1 ≤ λ 1 < λ N ≤ ξ m , ξ ‾ m ≡ m a x ( 1 , ξ m ) 0< \xi_{1} ≤ \lambda_{1} < \lambda_{N} ≤ \xi_{m} , \overline{\xi}{m}≡max(1,\xi{m}) 0<ξ1≤λ1<λN≤ξm,ξm≡max(1,ξm)

而在程序中，作者直接用 λ 1 \lambda_{1} λ1表示了 ξ 1 \xi_{1} ξ1，同时设定 ξ m \xi_{m} ξm为 λ N = 1 \lambda_{N}=1 λN=1。虽然可能有点误差，不过我觉得无可厚非。

关于函数句柄，需要注意的是，这里的x并不是迭代的解x，而是一个指代未知变量的参数。实际上这里的x可以用任何符合矩阵计算条件的参数，如下面的AT（y）中的y。

复制代码

if ~isa(A, 'function_handle')
   AT = @(x) A'*x;
   A = @(x) A*x;
end

Aty = AT(y);

（3）初始化。

初始化主要实现了 x 0 x_{0} x0的设置方法，验证了phi(x)和psi(x)函数是否有效，以及其他一些变量的初始设置。

（4）TwIST主循环迭代。

这一部分是整个代码中最主要的部分。

TwIST算法的迭代包含两个主要部分：TwIST迭代和IST迭代。IST_iters和TwIST_iters的值用于确定当前应该执行哪一种迭代。根据条件判断，当TwIST_iters达到特定阈值或满足特定条件时，会切换到执行IST迭代，而不是继续TwIST迭代；反之亦然。

这一部分主要包含2个while循环，两个while循环会一直运行，直到满足对应条件。

在第二个while循环中有一个 if-else结构，用于判断进行何种操作。在TwIST循环中，IST_iters和TwIST_iters并不会一直增加，而只是一个判断flag，结合对应的if else，完成判断。迭代次数的增加实际上由iter控制。

建议在主循环设置断点，并将IST_iters和TwIST_iters后边的分号去掉，使用demo进行调试。观察IST_iters和TwIST_iters的值变化。这样，IST_iters和TwIST_iters取什么值执行什么语句就一清二楚了。

去噪函数的作用

此外，在主循环中，还有一行比较重要。它是去噪函数的意义所在。

复制代码

x = psi_function(xm1 + grad/max_svd,tau/max_svd);

代码中其他位置的psi_function只是传参或者验证，而该位置的psi_function是起到了实质作用的。psi_function主要用于执行阈值或收缩操作，通常涉及对给定向量或信号进行阈值处理。它可能采用软阈值（soft thresholding）或硬阈值（hard thresholding）等技术，用于将信号的幅度调整为零或接近零，从而产生更稀疏的表示。

关于去噪函数的定义，原论文中并没有直接关于 Ψ λ \Psi_{\lambda} Ψλ的明确定义，仅仅在II. B 部分给出了一个形而上的说明。形而下的例子可以参考MATLAB文件夹中hard.m和soft.m，这是两个常用的去噪函数，硬阈值和软阈值。

稀疏性操作

复制代码

            if sparse
                mask = (x ~= 0);
                xm1 = xm1.* mask;
                xm2 = xm2.* mask;
            end

以上代码是处理稀疏性的操作。当 sparse 变量为真时（即 sparse 变量为非零值），代码会执行以下操作：

首先，创建一个逻辑掩码 mask，该掩码用于标识变量 x 中非零元素的位置。也就是说，mask 的元素为 1 表示对应 x 中的元素不为零，为 0 表示对应 x 中的元素为零。
然后，通过将 xm1 和 xm2 分别与 mask 相乘，将 xm1 和 xm2 中对应于 x 中零元素位置的部分置为零。
这样可以确保在算法的迭代过程中，对 x 的更新仅在非零位置进行，以保持其稀疏性。

（5）去偏。

在主循环之后，还有一个去偏阶段（debias phase）。这是一个可选操作，作者给出的解释是：

If the 'Debias' option is set to 1, we try to remove the bias from the l1 penalty, by applying CG to the least-squares problem obtained by omitting the l1 term and fixing the zero coefficients at zero.

可见，这一部分主要是为了消除l1惩罚的偏差。