论文阅读
Single Modality vs. Multimodality: What Works Best for Lung Cancer Screening?
解释了多模态传感器数据融合优势大于单一模态输入 里面介绍了多模态数据融合三种方法 其中全中间融合(Full Intermediate Fusion, FIF)方法效果最好
评价指标:
ROC曲线下面积(Area Under the ROC Curve, AUC)
AUC是一种广泛用于评估二分类模型性能的指标。它的值介于0到1之间,其中:
1:表示模型是完美的分类器,能够完全区分正类和负类。
0.5:表示模型性能与随机猜测相当,没有区分能力。
小于0.5:表示模型性能比随机猜测还要差。
AUC的优势在于:
对类别不平衡不敏感:在数据集中正负样本数量不均衡的情况下,AUC比准确率(Accuracy)等指标更能反映模型的真实性能。
独立于分类阈值:AUC评估的是模型在所有可能分类阈值下的表现,而不是依赖于某个特定的阈值。这意味着它能更全面地衡量模型的排序能力,即模型将正样本排在负样本之前的能力。
存在的问题:
- 数据集来源:研究使用的是国家肺癌筛查试验(NLST)数据集。虽然这是一个大型数据集,但其数据特点(例如,参与者年龄、吸烟史等)可能限制了模型在其他人群或不同筛查背景下的泛化能力。
2.影像数据处理:CT扫描来自不同的设备和扫描协议,导致切片厚度和像素间距的差异。尽管进行了重采样和归一化处理以确保同质性,但这仍然可能引入一些信息损失或偏差。
3.结节ROI的获取方式:数据集中不提供已识别结节的分割掩膜,而是手动创建了包含结节的20 × 50 × 50边界框。这种手动创建可能引入主观性或误差,并且可能没有充分捕捉结节的完整形态信息。
4.临床特征选择:尽管从原始的324个特征中筛选出136个特征,并进一步缩小到42个特征,但特征选择过程可能存在主观性,并且可能没有包含所有对肺癌预测有用的临床信息。
5.单一病理关注:研究主要关注肺癌的预测,而肺癌本身是一种复杂的疾病,受多种生物和生理现象以及多种因素影响。模型可能未能完全捕捉所有这些复杂性
AI-Driven Sensing Technology: Review
机器学习和深度学习对传感技术的贡献分为四个主要领域:传感器设计、校准和补偿、对象识别和分类以及行为预测
深度学习在传感器设计方面扮演着重要角色
传统传感器设计 vs. 逆向设计
首先,我们来看传统的传感器设计流程。通常,工程师会:
确定传感器功能需求:比如,需要一个能测量特定压力范围的传感器,或者一个对某种气体敏感的传感器。
选择材料和结构:基于物理原理和工程经验,选择合适的敏感材料和结构设计(比如膜的厚度、形状、电极布局等)。
制造和测试:制造出传感器原型,然后进行测试,看它是否达到了预期的性能。
迭代优化:如果性能不达标,就需要修改材料或结构,重新制造和测试,这个过程可能非常耗时耗力。
这个传统过程是从"结构"推导"功能":先设计结构 → 再看能实现什么功能。
深度学习的"逆向设计"
而深度学习在传感器设计中的"逆向设计"则反过来了。它不是从结构出发,而是从"功能需求"出发,让深度学习模型来帮助我们找到实现这些功能的"最佳结构"。
可以这样理解:
定义"预期性能结果":
假设我们想要一个压力传感器,它需要在0到100kPa的压力范围内,输出信号的线性度非常好(比如R²值要达到0.99以上),并且灵敏度要高(比如每kPa压力变化,输出电压变化1mV)。
或者我们希望一个气体传感器,它能准确识别某种气体,并且对其他气体不敏感。
建立"结构-性能"的映射模型:
在传统的工程中,我们通过物理方程和仿真来理解结构和性能之间的关系。
在深度学习的逆向设计中,我们训练一个深度学习模型(例如人工神经网络ANN)。这个模型通过学习大量的不同传感器结构 与它们对应的实际性能数据之间的关系 ,来掌握这种复杂的映射。
想象一下,你给模型输入成千上万种不同的传感器几何形状(比如膜的厚度、电极的间距、材料的弹性模量等)。
同时,你告诉模型这些不同结构各自的性能表现(比如线性度、灵敏度、响应时间等)。
模型通过学习这些数据,逐渐理解了什么样的结构会导致什么样的性能 。
"反向推导"最佳结构:
一旦深度学习模型学习到了这种"结构-性能"的复杂关系,我们就可以利用它的"反向"能力。
我们不再输入结构让它预测性能,而是输入我们"想要的性能"(比如我们前面设定的高线性度、高灵敏度),然后让这个训练好的深度学习模型反向推导出"最可能实现这些性能的传感器结构参数。
这个过程就像:你告诉一个非常聪明的"设计助手"你想要什么样的产品(功能),它就能根据它学到的知识,给你推荐最合适的设计方案(结构)。
为什么深度学习能做到这一点?
处理复杂非线性关系:传感器结构和性能之间的关系往往非常复杂且是非线性的,传统方法难以精确建模。深度学习(特别是神经网络)擅长从大量数据中学习并捕捉这种复杂的非线性映射。
探索巨大的设计空间:传感器的设计参数(几何形状、材料属性等)组合起来会形成一个极其庞大的设计空间。人工尝试和优化非常低效。深度学习模型可以更有效地在这个巨大空间中搜索,找到潜在的最佳设计。
加速设计周期:通过模型直接给出设计建议,可以大大减少传统"设计-制造-测试-修改"的迭代循环,从而缩短传感器从概念到原型的开发时间。
举例说明:电容式压力传感器
文章中提到了一个例子:使用功能链接人工神经网络(FLANN)来设计电容式压力传感器1。
传统方法:工程师需要根据压力和电容变化的物理公式,手工计算或仿真不同膜片厚度、电极面积、介质材料等参数对传感器响应曲线(压力-电容关系)的影响。这个过程可能需要多次尝试才能找到一个相对满意的设计。
深度学习逆向设计:
收集大量已知压力传感器(具有不同几何形状和材料)的实际测试数据,包括它们的具体结构参数和在不同压力下的电容输出。
用这些数据训练一个FLANN模型,让它学习"结构参数"如何影响"压力-电容响应曲线"。
现在,如果你想要一个在特定压力范围内具有特定线性度(比如非常接近直线)和灵敏度(比如电容变化量)的传感器,你就可以把这些"性能目标"输入到训练好的FLANN模型中。
FLANN模型会根据它学到的知识,"反向推导出"最符合这些性能目标的膜片厚度、电极布局等几何参数。工程师就可以直接拿着这些参数去制造,大大提高了设计效率和成功率。
"逆向设计"的核心就是利用深度学习模型强大的学习和映射能力,从期望的功能出发,反向推导出实现这些功能的具体物理结构,从而革新了传感器等硬件的设计流程。
上一部分我们讲了"逆向设计",那是关于如何设计传感器本身的物理结构。而性能增强则更多是关于传感器在工作时,如何更好地处理它收集到的数据,从而提升其输出的质量和可靠性。
简单来说,"性能增强"就是让传感器变得更"聪明"**,能从原始、可能带有噪声或不完整的数据中,提取出更准确、更有用的信息。**这就像一个人的感官(眼睛、耳朵)收集到信息后,大脑(深度学习算法)对这些信息进行处理和解读,从而做出更准确的判断。
提高检测精度和定位能力
例如,有研究利用机器学习检测压力及其在传感器上的位置,通过分析不同频率信号收集到的阻抗和电容数据 ,识别关键统计特征,并使用K-近邻(KNN)、线性判别分析(LDA)和决策树(DT)等算法进行处理,在三区域传感器上实现了超过99%的位置和压力强度检测准确率。
传统挑战:传感器(特别是阵列传感器)在检测压力时,可能只是简单地输出每个感应点的数值。要从这些数值中精确判断压力的大小,尤其是在复杂或多点压力的情况下,并确定压力的具体位置,可能需要复杂的物理模型或大量的校准。
深度学习如何增强:
数据收集:传感器在不同压力和位置下,会产生不同频率的阻抗和电容信号。这些信号是原始数据。
特征识别:机器学习算法(KNN, LDA, DT)能够从这些原始信号中自动识别出"关键统计特征 "。这些特征可能不是人能轻易看出来的,但它们与压力大小和位置有着内在的关联。
模式学习:通过大量带标签的数据(即知道在某个位置施加了多大压力时,传感器会产生什么样的信号),机器学习算法学习这些特征与实际压力大小和位置之间的复杂映射关系。
高准确率:一旦学习完成,当传感器接收到新的、未知的信号时,算法就能根据学到的模式,高精度地推断出压力的精确位置和强度。
理解:这就像给传感器装了一个"大脑",它不再是简单地"感受"信号,而是能"理解"信号背后的含义,从而实现更精细的感知。
2. 自动学习特征和实现预测
卷积神经网络(CNNs)模型可以自动学习压力信号的特征表示,用于分类或回归预测 ,例如在机器人和假肢应用中,通过无线压力传感器收集大量压力信号数据,训练CNN模型以实时监测压力,并消除复杂的外部布线。
传统挑战:在机器人或假肢中,需要实时、精确地感知压力,以实现灵活的抓取或行走。传统的传感器系统可能需要复杂的硬件线路进行信号预处理和特征提取,且难以适应多变的应用场景。
深度学习如何增强:
自动特征学习:CNN特别擅长处理图像、时间序列等具有局部相关性的数据 。压力传感器的数据可以被视为一种"压力图像"或"压力时间序列"。CNN能够自动从这些原始数据中学习有效的特征(例如,压力分布的形状、随时间的变化趋势),而无需人工设计特征。
分类/回归预测:学习到的特征可以直接用于:
分类:判断是"轻触"、"抓握"还是"重压"等 。
回归:精确预测压力的具体数值。
简化系统:通过深度学习模型在软件层面处理复杂信号,可以减少对复杂外部布线和硬件电路的需求,使传感器系统更加集成、轻便,并能实时响应。
3. 提高检测限(LOD)和抗噪声能力
**深度学习算法还可以提高传感器的检测限(LOD),例如通过深度神经网络(DNNs)和门控循环单元(GRUs)训练化学传感器的实时噪声信号,建立氢浓度与信号噪声之间的隐藏关系,显著提高了气体传感器在检测低浓度氢气时的准确性。
传统挑战:传感器的检测限是指它能检测到的最低浓度或最小量。在低浓度检测时,信号往往非常微弱,很容易被环境噪声淹没。传统的信号处理方法可能难以区分真实信号和噪声,导致检测限较高。
深度学习如何增强:
噪声与信号的关系:DNN和GRU等深度学习模型能够从大量的实时噪声信号中,学习到噪声的模式,以及在噪声背景下真实信号的微弱特征 。更重要的是,它们可以发现"信号噪声"与"被测物质浓度"之间可能存在的非线性、隐藏的关联 。
去噪与增强:通过学习这种关系,深度学习模型可以有效地从噪声中"提取"出微弱的信号,相当于进行了一种高级的去噪和信号增强,从而使得传感器能够检测到更低浓度的物质。
理解:深度学习在这里就像一个"超级滤波器",它不仅能滤除干扰,还能从看似随机的噪声中发现与目标相关的微弱线索,让传感器"听"到更细微的"声音"。
4. 改进关键参数和处理复杂数据
在光纤布拉格光栅传感器中,ML/DL算法被广泛应用于改进量程、信噪比和精度等关键参数。例如**,长短期记忆(LSTM)神经网络模型可以将原始光谱数据转换为一维或二维数据,从而实现精确的压力预测,**实验证明LSTM模型比传统机器学习方法具有更高的准确性。
传统挑战:光纤传感器输出的是复杂的光谱数据,从中提取压力信息需要复杂的算法。同时,要提高传感器的量程(能测量的范围)、信噪比(信号清晰度)和精度,传统方法往往有物理极限。
深度学习如何增强:
处理序列数据:LSTM特别擅长处理时间序列数据(如光谱随时间的变化)。它可以捕捉光谱数据中的长期依赖关系和复杂模式。
高维到低维映射:将原始的高维光谱数据(复杂的波形)通过LSTM转换为低维(一维或二维)的特征表示,这大大简化了后续的预测任务。
精确预测:通过学习这些特征与实际压力之间的关系,LSTM能够实现比传统方法更精确的压力预测。
理解:LSTM在这里是一个"智能数据转换器和预测器",它能将复杂、高维的原始传感器数据进行高效的压缩和特征提取,并直接给出高精度的预测结果 。
5. 解决交叉敏感性问题
此外,ML/DL算法还能通过学习反射光谱与温度、应变之间的关系,有效分离温度和应变,解决光纤传感器在应变和温度交叉敏感性方面的挑战,提高测量精度。
传统挑战:许多传感器(如光纤布拉格光栅传感器)对多种物理量都敏感 。例如,它可能同时受到温度和应变的影响,导致测量结果不准确,因为你不知道信号变化到底是温度引起的还是应变引起的,这就是"交叉敏感性"。
深度学习如何增强:
多变量学习:深度学习模型能够同时学习传感器输出(反射光谱)与多个输入变量(温度和应变)之间的复杂、非线性关系。
信号解耦:通过大量的训练数据,模型能够识别出光谱中哪些变化模式主要与温度相关,哪些主要与应变相关。它能够有效地"解耦"这些信号,从而从混合信号中精确地分离出温度和应变各自的贡献。
理解:深度学习在这里扮演了一个"智能分析师"的角色,它能从混合信息中抽丝剥茧,区分出不同因素对传感器输出的影响,让传感器能够更"纯粹"地测量目标物理量。
总结"性能增强"
智能信号处理:自动从原始、复杂的传感器信号中提取有意义的特征,无需人工干预。
去噪与信号增强:有效区分真实信号与噪声,提高传感器在恶劣环境或低检测限下的表现。
复杂映射学习:学习传感器输入(物理量)与输出(信号)之间的高度非线性关系,实现更准确的测量和预测。
多变量解耦:解决传感器交叉敏感性问题,从混合信号中分离出不同物理量的贡献。
简化系统:将复杂的信号处理任务从硬件转移到软件,降低硬件成本和复杂性,提高系统的灵活性和适应性。
深度学习在传感器校准和补偿
解决传感器在操作过程中因各种环境因素、内部漂移和老化效应引起的信号失真,从而提高测量结果的准确性和稳定性。
预使用校准
传统校准的挑战 :传感器在使用前需要进行校准,以确保其输出与实际物理量之间的准确对应关系。然而,传感器的响应往往是非线性的,并且容易受到温度、湿度、电压波动等环境因素的影响。传统的校准方法通常需要大量的重复测试,耗时且成本高昂,特别是在处理非线性响应时。
深度学习如何增强校准:
处理非线性响应:深度学习算法,如人工神经网络(ANN)、多层感知机(MLP)和极限学习机(ELM),能够学习传感器复杂的非线性响应曲线。这意味着它们可以根据传感器在不同环境条件下的输出,精确地映射出其真实值。
减少校准工作量和时间:通过训练深度学习模型,可以将环境因素(如温度、电压)的影响纳入校准过程。一旦模型学会了如何根据这些因素调整传感器的读数,就可以大大减少对重复校准测试的需求。例如,对于电容式压力传感器,基于粗糙集神经网络(RSNNs)的自动校准算法可以建模传感器的响应特性,并使用神经网络校准传感器对温度变化的非线性响应,将精度提高到±2.5%(FS)2。MLP算法也能在相同温度范围内将压力估计误差控制在±1%(FS)以内。
快速准确校准 :对于非线性温度传感器,基于ANN的自动校准方法能够提供比分段线性化和多项式线性化方法更优的整体精度,使得智能传感器能够更快、更准确地进行校准,解决偏移、增益变化和非线性等问题。ELM在压力传感器校准中也表现出卓越的精度和速度,RMSE为0.546,校准时间仅为1.3秒。
在线校准能力:一些方法,如基于自适应网络模糊推理系统(ANFIS)的两阶段方法,只需较少的校准点和计算能力即可实现再校准,甚至支持在线校准,大大提高了校准的灵活性和实用性。
- 使用中补偿 (In-Use Compensation)
传统补偿的挑战:传感器在实际使用过程中,其性能可能会随着时间、环境变化(如温度漂移、老化、电源噪声、制造缺陷等)而发生漂移,导致测量结果的准确性逐渐下降。传统上,这可能需要定期重新校准或复杂的硬件补偿电路。
深度学习如何增强补偿:
自动适应环境变化:深度学习算法能够在传感器运行过程中实时监测其输出,并根据当前的环境条件自动调整读数,以补偿各种干扰。这使得传感器能够长时间保持高精度,而无需频繁的人工干预。
温度误差补偿:温度对压力传感器信号的影响显著。ANN策略可以为压阻式微机械多孔硅传感器提供智能温度补偿,通过最小化传感器偏置电压波动来实现温度无关的输出,将未补偿的温度误差降低约98%6。MLP模型在极端条件下也能实现高精度的自动补偿(±0.5%以内)7。
应对多种误差源:除了温度,传感器误差还可能来自电源噪声、半导体信号干扰、固定偏移、以及随时间变化的漂移(如老化和中毒)。深度学习方法可以处理这些复杂的、多源的误差。例如,CNN可以减轻惯性传感器信号中的干扰,FLANN可以补偿压力传感器环境变化、制造参数偏移和老化效应,使最大误差保持在±2%以内8。
解决传感器老化和中毒:对于气体传感器,老化和中毒是常见问题。机器学习中的集成方法(如SVM的加权分类器组合)可以通过更新分类器权重来识别和补偿漂移,提高气体识别的准确性8。
声学信号补偿:深度学习还被应用于声学信号处理,例如通过四种神经网络模型(FCNN、LSTM、BLSTM、CRNN)来提取和增强语音数据特征,提升喉部麦克风捕获的衰减语音信号的质量,即使在传统麦克风会丢失辅音音素的情况下也能显著提高语音清晰度9。
挑战
尽管深度学习在校准和补偿方面带来了显著的优势,但也存在挑战:
数据需求:ML/DL模型通常需要大量的训练数据,而传感器数据采集在某些场景下可能受限,导致模型过拟合。
泛化能力:训练好的模型在新的环境或未见过的场景中可能表现不佳,因为模型难以解释设备多场响应的复杂相互作用,也无法预测随时间变化的性能(如老化)。这限制了AI驱动传感器设计的通用性10。
模型可解释性:深度学习模型通常是"黑箱"模型,难以量化解释导致设备漂移的各种因素的比例,这限制了对传感器设计改进的指导11。
总结
深度学习在传感器校准和补偿方面的作用可以概括为:
自动化和智能化:将传统的繁琐、耗时的校准和补偿过程自动化,并使其更具智能化,能够自适应环境变化。
高精度:通过学习复杂的非线性关系,显著提高传感器的测量精度和稳定性。
多因素处理:能够同时处理由多种环境因素、内部漂移和老化效应引起的误差。
减少维护成本:降低对频繁校准和硬件补偿的需求,延长传感器使用寿命。
通过深度学习,传感器不再是固定参数的设备,而成为能够自我学习、自我适应和自我校正的智能系统,从而在各种复杂应用场景中提供更可靠、更准确的测量数据。