我的博客年度总结
今年写了三百多篇文章,回头看,有一个问题贯穿始终:信号处理和深度学习,到底是什么关系?
这个问题不是凭空来的。过去发表的博文,一边是傅里叶变换、小波分析、谱估计这些经典信号处理方法,一边是扩散模型、神经架构搜索、模型量化这些深度学习技术。有读者问过我:这两个方向差别这么大,为什么放在一起写?
这一年的写作,让我逐渐想清楚了这个问题。
一、表面上的联系:技术链条
最直观的联系是,它们在实际系统中是串联的。
以毫米波雷达为例。雷达发射电磁波,接收回波,得到的是原始信号。这个信号要经过混频、采样、FFT,变成Range-Doppler图。然后才能用检测算法找目标,用深度学习做分类或跟踪。
整个流程是:
原始信号 → 信号处理 → 特征表示 → 智能算法 → 决策输出
信号处理在前,深度学习在后。前面做不好,后面再强也没用。
这是我最初的理解:它们是上下游关系,各管一段。
二、深一层的联系
写得多了,我发现它们在思维方式上有共通之处。
都是在做变换。
傅里叶变换把信号从时域变到频域,小波变换把信号分解到不同尺度,这些是信号处理的基本操作。神经网络做的事情类似:把输入数据通过一层层变换,映射到一个更容易处理的空间。
它们都在处理不确定性。
信号处理里,噪声是核心问题。怎么从带噪信号里提取有用信息,怎么估计信号的统计特性,这些问题催生了维纳滤波、卡尔曼滤波、贝叶斯估计等方法。深度学习里,不确定性同样重要。扩散模型的数学基础是概率论,VAE用的是变分推断,贝叶斯神经网络直接对权重建模为分布。
并且都要在约束下求最优。
雷达波形设计要在带宽、功率、模糊函数之间权衡。模型压缩要在精度、速度、内存之间权衡。数学上都是优化问题,区别只在于目标函数和约束条件不同。
认识这一层,再看两个领域,很多东西就通了。
三、更深的联系:互为工具
再往深想,它们不只是思维相通,而是可以互为工具。
信号处理为深度学习提供先验。
直接用神经网络处理原始雷达数据,可以做,但效率不高。如果先做Range-Doppler处理,网络的输入就从一维时序信号变成了二维图像,问题难度大幅下降。比如图像处理里,很多网络结构的设计借鉴了人类视觉系统的原理。语音识别里,梅尔频谱是标准的预处理步骤,背后是听觉感知的研究成果。
深度学习为信号处理提供新方法。
而反过来,深度学习也在改变信号处理。传统的DOA估计用MUSIC、ESPRIT这些子空间方法,现在有人用神经网络直接从协方差矩阵估计角度。传统的图像去噪用滤波器,现在扩散模型的效果更好。
这并不意味着传统方法没用了,而是多了一类工具。什么时候用什么,取决于具体问题。
四、写作的内容总结
信号处理基础:傅里叶变换、小波变换、谱估计这些,是理解后面内容的基础。不懂频域分析,就看不懂雷达信号处理。不懂概率论,就看不懂扩散模型。
雷达信号处理:这是信号处理的一个重要应用领域。从FMCW原理到MIMO波形设计,从目标检测到干扰抑制,涉及的数学和算法很丰富。
深度学习理论:扩散模型、知识蒸馏、神经架构搜索这些,是当前AI领域的热点。我关注的不是怎么调参,而是背后的数学原理。
嵌入式AI:这是把深度学习落地的关键环节。模型压缩、量化、高效推理,解决的是"怎么让AI跑在资源受限设备上"的问题。
这四块内容,对应的就是从信号到智能这条路上的不同阶段。
五、一个没想清楚的问题
写了这么多,有一个问题我还没完全想清楚:AI会在多大程度上替代传统信号处理方法? 目前浅显的观察是,在数据充足、计算资源够用的场景,端到端的深度学习方法往往效果更好。但在数据稀缺、实时性要求高、可解释性重要的场景,传统方法仍然有优势。
未来会怎样?两者会融合到什么程度?这些问题,可能需要更长时间才能看清楚。
结尾
回到开头的问题:信号处理和深度学习是什么关系?我认为,它们是理解世界的两套工具,底层逻辑相通,应用上互补。学好任何一个都有价值,但如果能把两者打通,能做的事情会更多。
这一年的写作,帮我把这个问题想清楚了一些。明年继续写,继续想。
DuHz