TwIST算法MALTLAB主程序详解

TwIST算法MALTLAB主程序详解

关于TwIST算法的具体原理可以参考:

链接: https://ieeexplore.ieee.org/abstract/document/4358846

链接: https://blog.csdn.net/jbb0523/article/details/52193209

该算法的MATLAB源代码:

链接: http://www.lx.it.pt/~bioucas/TwIST/TwIST.htm

1. 函数定义与输入输出变量

主函数的定义如下所示,TwIST包含7个输出变量和若干个输入变量,其中包含3个必需输入变量和若干个可选输入变量(varargin)。具体每个变量的含义可以参考MATLAB TwIST.m文件中的解释。下文仅对一些关键参数进行解释。

复制代码
function [x,x_debias,objective,times,debias_start,mses,max_svd] = ...
         TwIST(y,A,tau,varargin)

该算法主要解决如下正则化问题:

复制代码
arg min_x = 0.5*|| y - A x ||_2^2 + tau phi( x )

也就是论文中式(1)所示,注意在MATLAB代码中存在一些符号表示的改变。如K➡A,λ➡tau等。

其具体的迭代公式如原论文中式(17)-(19)所示

从式(17)-(19)中看,我们需要设置 x 0 , α , β , y , K , Ψ λ x_{0},\alpha,\beta,y,K,\Psi_{\lambda} x0,α,β,y,K,Ψλ等一系列参数,迭代公式方可正确运行。算法的输出变量,x即为目标的估计值,x_debias为目标估计值的去偏结果,获得这一结果往往需要在主循环迭代结束后,通过适当的去偏迭代,消除正则化器造成的一些偏差。

输入变量 含义
y 测量结果,可以为一维向量或者二维数组
A 对应原论文中的K
tau 正则化参数,对应原论文中的λ
Psi 去噪函数句柄,对应原论文中的去噪函数ψ
Phi 正则化器的函数句柄,对应原论文中的Φ
lambda TwIST算法的lam1参数,对应原论文中的 λ 1 \lambda_{1} λ1参数,论文中的 λ N \lambda_{N} λN在程序中被设置为常数1。若 λ 1 = 1 \lambda_{1}=1 λ1=1,TwIST算法等价于IST算法。
alpha TwIST的alpha参数 (详见论文式 (22))
beta TwIST的beta参数 (详见论文式 (23))

2.算法主要步骤

TwIST.m的代码很长,但主要包含的内容并不多。下文主要对在代码中关键部分进行解释。按照从前往后的顺序,主要包含了以下几个内容:

(1)变量注释。

这一部分对函数的每一个变量都进行了注释,包括必须变量和可选变量。建议按照以上迭代公式了解关键参数的含义。

(2)变量设定。

这一部分主要在变量注释和初始化两部分之间。

主要定义了

  • 各个变量的默认值。
  • 使用一个switch-case分支语句读取varargin所代表的可选输入参数,实现可选变量的自定义功能。
  • 对主要变量,如alpha和beta进行设定。对于这个部分,多说一点。如原论文中所示


实际上存在如下关系:

0 < ξ 1 ≤ λ 1 < λ N ≤ ξ m , ξ ‾ m ≡ m a x ( 1 , ξ m ) 0< \xi_{1} ≤ \lambda_{1} < \lambda_{N} ≤ \xi_{m} , \overline{\xi}{m}≡max(1,\xi{m}) 0<ξ1≤λ1<λN≤ξm,ξm≡max(1,ξm)

而在程序中,作者直接用 λ 1 \lambda_{1} λ1表示了 ξ 1 \xi_{1} ξ1,同时设定 ξ m \xi_{m} ξm为 λ N = 1 \lambda_{N}=1 λN=1。虽然可能有点误差,不过我觉得无可厚非。

关于函数句柄,需要注意的是,这里的x并不是迭代的解x,而是一个指代未知变量的参数。实际上这里的x可以用任何符合矩阵计算条件的参数,如下面的AT(y)中的y。

复制代码
if ~isa(A, 'function_handle')
   AT = @(x) A'*x;
   A = @(x) A*x;
end

Aty = AT(y);

(3)初始化。

初始化主要实现了 x 0 x_{0} x0的设置方法,验证了phi(x)和psi(x)函数是否有效,以及其他一些变量的初始设置。

(4)TwIST主循环迭代。

这一部分是整个代码中最主要的部分。

TwIST算法的迭代包含两个主要部分:TwIST迭代和IST迭代。IST_iters和TwIST_iters的值用于确定当前应该执行哪一种迭代。根据条件判断,当TwIST_iters达到特定阈值或满足特定条件时,会切换到执行IST迭代,而不是继续TwIST迭代;反之亦然。

这一部分主要包含2个while循环,两个while循环会一直运行,直到满足对应条件。

在第二个while循环中有一个 if-else结构,用于判断进行何种操作。在TwIST循环中,IST_iters和TwIST_iters并不会一直增加,而只是一个判断flag,结合对应的if else,完成判断。迭代次数的增加实际上由iter控制。

建议在主循环设置断点,并将IST_iters和TwIST_iters后边的分号去掉,使用demo进行调试。观察IST_iters和TwIST_iters的值变化。这样,IST_iters和TwIST_iters取什么值执行什么语句就一清二楚了。

去噪函数的作用

此外,在主循环中,还有一行比较重要。它是去噪函数的意义所在。

复制代码
x = psi_function(xm1 + grad/max_svd,tau/max_svd);

代码中其他位置的psi_function只是传参或者验证,而该位置的psi_function是起到了实质作用的。psi_function主要用于执行阈值或收缩操作,通常涉及对给定向量或信号进行阈值处理。它可能采用软阈值(soft thresholding)或硬阈值(hard thresholding)等技术,用于将信号的幅度调整为零或接近零,从而产生更稀疏的表示。

关于去噪函数的定义,原论文中并没有直接关于 Ψ λ \Psi_{\lambda} Ψλ的明确定义,仅仅在II. B 部分给出了一个形而上的说明。形而下的例子可以参考MATLAB文件夹中hard.m和soft.m,这是两个常用的去噪函数,硬阈值和软阈值。

稀疏性操作

复制代码
            if sparse
                mask = (x ~= 0);
                xm1 = xm1.* mask;
                xm2 = xm2.* mask;
            end

以上代码是处理稀疏性的操作。当 sparse 变量为真时(即 sparse 变量为非零值),代码会执行以下操作:

  • 首先,创建一个逻辑掩码 mask,该掩码用于标识变量 x 中非零元素的位置。也就是说,mask 的元素为 1 表示对应 x 中的元素不为零,为 0 表示对应 x 中的元素为零。
  • 然后,通过将 xm1 和 xm2 分别与 mask 相乘,将 xm1 和 xm2 中对应于 x 中零元素位置的部分置为零。
  • 这样可以确保在算法的迭代过程中,对 x 的更新仅在非零位置进行,以保持其稀疏性。

(5)去偏。

在主循环之后,还有一个去偏阶段(debias phase)。这是一个可选操作,作者给出的解释是 :

If the 'Debias' option is set to 1, we try to remove the bias from the l1 penalty, by applying CG to the least-squares problem obtained by omitting the l1 term and fixing the zero coefficients at zero.

可见,这一部分主要是为了消除l1惩罚的偏差。

相关推荐
YuTaoShao5 小时前
【LeetCode 热题 100】141. 环形链表——快慢指针
java·算法·leetcode·链表
小小小新人121236 小时前
C语言 ATM (4)
c语言·开发语言·算法
你的冰西瓜6 小时前
C++排序算法全解析(加强版)
c++·算法·排序算法
এ᭄画画的北北7 小时前
力扣-31.下一个排列
算法·leetcode
绝无仅有7 小时前
企微审批对接错误与解决方案
后端·算法·架构
用户5040827858398 小时前
1. RAG 权威指南:从本地实现到生产级优化的全面实践
算法
Python×CATIA工业智造9 小时前
详细页智能解析算法:洞悉海量页面数据的核心技术
爬虫·算法·pycharm
无聊的小坏坏10 小时前
力扣 239 题:滑动窗口最大值的两种高效解法
c++·算法·leetcode
黎明smaly10 小时前
【排序】插入排序
c语言·开发语言·数据结构·c++·算法·排序算法