(论文速读)1DCNN-LSTM-ResNet:建筑损伤检测方法

论文题目:A novel approach model design for signal data using 1DCNN combing with LSTM and ResNet for damaged detection problem(将1DCNN与LSTM和ResNet相结合,设计了一种新的信号数据损伤检测方法模型)

会议:Structures (工程技术 2区, 小类土木)

摘要:在当今时代,时间序列数据被广泛应用于不同的领域。在结构健康监测(SHM)中,时间序列数据的应用也非常广泛。然而,传统的机器学习(ML)方法,如应用于SHM的人工神经网络,已经不足以有效地处理和准确诊断基于时间相关数据的结构损伤。为了解决这一问题,本研究提出了一种新的深度学习方法,该方法集成了一维卷积神经网络(1DCNN)、长短期记忆网络(LSTM)和残差网络(ResNet),以提高建筑损伤检测的效率。该方法将1DCNN用于特征提取,LSTM用于识别长期依赖关系,ResNet用于克服深度网络训练中的梯度消失问题。通过SHM领域最全面的数据集之一Z24桥数据集对该方法的有效性进行了评估。结果表明,该方法的准确率为81.5%,显著优于传统的1DCNN(78.7%)、LSTM(79.3%)网络和组合的1DCNNLSTM网络(80.6%)。这强调了整合深度学习技术的有效性。所提出的1DCNN-LSTM-ResNet方法具有较高的精度和效率,在SHM的实际应用中具有较大的潜力。

1DCNN-LSTM-ResNet融合模型详解

引言

在当今数字化时代,基础设施和建筑结构产生的数据量正在急剧增长。如何高效、准确地分析这些数据以诊断结构损伤,已成为结构健康监测(Structural Health Monitoring, SHM)领域的核心挑战。今天,我们来深入解读一篇发表在《Structures》期刊上的重要论文------《A novel approach model design for signal data using 1DCNN combining with LSTM and ResNet for damaged detection problem》。

这篇论文由越南交通运输大学的Le-Xuan Thang、Bui-Tien Thanh和Tran-Ngoc Hoa三位研究者共同完成,提出了一种创新的深度学习方法,将1D卷积神经网络(1DCNN)、长短期记忆网络(LSTM)和残差网络(ResNet)三种架构融合,用于解决结构损伤检测问题。


一、研究背景与问题

1.1 传统方法的困境

在结构健康监测领域,时序数据被广泛应用于监测桥梁、建筑物等基础设施的健康状态。然而,传统的机器学习方法(如人工神经网络)在面对大规模时序数据时,诊断准确性已显不足。这些方法往往只在较小数据集上表现良好,难以应对实际工程中海量传感器数据的处理需求。

1.2 单一深度学习模型的局限性

虽然深度学习技术为SHM领域带来了新的可能,但单一的深度学习模型各有其固有缺陷:

1DCNN(一维卷积神经网络)的局限

  • 擅长识别数据中的局部模式和特征
  • 在捕获长期依赖关系方面表现不佳
  • 当卷积核尺寸不够大时,难以理解序列的全局上下文

LSTM(长短期记忆网络)的局限

  • 训练时间相对较长(由于其循环特性)
  • 复杂的架构容易导致过拟合
  • 顺序计算的特性使其难以在GPU上实现并行化
  • 在某些条件下仍可能出现梯度饱和问题

深层网络的通病

  • 随着网络深度增加,梯度消失和梯度爆炸问题日益严重
  • 深层网络的训练变得极具挑战性

1.3 SHM数据的特殊性

结构健康监测中的传感器数据不仅具有时间维度的依赖性,还存在空间维度的关联性------来自不同位置传感器的数据往往相互关联。这要求模型能够同时处理时空特征,而这正是单一模型难以完美胜任的。


二、创新方法:1DCNN-LSTM-ResNet融合架构

2.1 核心思想

研究者提出的创新点在于:将三种深度学习网络的优势进行有机融合,使其各自的长处能够弥补其他网络的短板。

  • 1DCNN:负责从数据序列中提取局部特征

  • LSTM :捕获数据中的长期时序依赖关系

  • ResNet :通过残差连接解决深层网络的梯度消失问题

2.2 网络架构详解

整个模型的工作流程可分为两条路径:序列路径捷径路径

序列路径(Sequence Path)
  1. 输入层:输入张量 X ∈ R^(N×T×D),其中N为样本数,T为时间步数,D为输入特征数

  2. 初始卷积层:通过1DCNN提取早期特征

    复制代码
    X_conv1 = σ(BN(W_conv1 * X + b_conv1))
  3. ResNet块:包含多个卷积层和关键的捷径连接

    • 每个卷积操作:X_res = σ(BN(W_conv_i * X + b_conv_i))
    • 捷径连接:X_shortcut = W_shortcut * X_previous + b_shortcut
    • 合并输出:X_out = ReLU(X_res + X_shortcut)
  4. 扩张ResNet块(Dilated ResNet Block)

    • 使用扩张卷积捕获多尺度信息
    • 能从更广泛的邻域环境收集特征
    • 与常规ResNet块输出合并:X_merged = X_out + X_dilated
  5. LSTM层:处理合并后的张量,捕获时序依赖

    复制代码
    h_t = LSTM(X_merged)
捷径路径(Shortcut Path)

这是本研究的一大创新------双重跳跃连接

  1. 第一条捷径:从原始输入建立

    复制代码
    X_shortcut1 = BN(W_s1 * X_input + b_s1)
  2. 第二条捷径:从常规ResNet块输出建立

    复制代码
    X_shortcut2 = BN(W_s2 * X_merged + b_s2)
  3. 特征融合:两条捷径与LSTM输出进行拼接

    复制代码
    X_concat = [h_t, X_shortcut1, X_shortcut2]
输出层
  1. 全局池化:结合全局平均池化和全局最大池化

    复制代码
    X_avg = Average(X_concat)
    X_max = Max(X_concat)
    X_pooled = [X_avg, X_max]
  2. 全连接层:生成最终预测

    复制代码
    X_dense1 = σ(W_d1 · X_pooled + b_d1)
    X_out = Softmax(W_d2 · X_dense1 + b_d2)

2.3 五大关键创新点

  1. 三网融合架构:首次将1DCNN、LSTM和ResNet三种网络有机结合,各取所长

  2. 扩张ResNet块:引入扩张卷积,扩大感受野,捕获多尺度信息

  3. 双重跳跃连接:提供粗粒度(早期)和细粒度(深层)特征的双重传递

  4. 双重全局池化:结合平均池化和最大池化,最大限度保留关键信息

  5. 批归一化优化:在序列路径和捷径路径中都集成BN,加速训练并提高稳定性


三、实验验证:Z24桥梁数据集

3.1 数据集介绍

研究者选用了结构健康监测领域最具代表性的数据集之一------Z24桥梁数据集

Z24桥梁简介

  • 位置:瑞士伯尔尼区Solothurn附近
  • 类型:预应力混凝土箱梁桥
  • 跨度:主跨30米,两侧各14米
  • 历史:1998年底因修建新铁路而拆除

数据采集

  • 使用16个加速度传感器
  • 采样频率:100 Hz
  • 每次设置时长约10.9分钟
  • 总共采集65,536个样本

损伤场景:定义了16种不同的损伤状态,包括:

  • 完好状态(标签0、1、7)
  • 桥墩沉降(20mm、40mm、80mm、95mm)
  • 基础倾斜
  • 剥落损伤(12m²、24m²)
  • 滑坡
  • 锚固件损伤(1根柱、2个锚固件、4个锚固件)
  • 预应力筋损伤(2根、4根)

3.2 数据处理

  • 将样本划分为5个时间序列,每个长度8000
  • 每个损伤场景使用9个设置
  • 总样本数:5 × 9 × 16 = 720个样本
  • 训练集/验证集比例:70%/30%(504/216个样本)

3.3 实验环境

  • 操作系统:Windows 11 64位
  • 处理器:AMD Ryzen 5 4600H(12核,约3.0 GHz)
  • 软件:Python 3.9.17 + TensorFlow
  • 优化算法:Adam
  • 训练轮次:100个epoch
  • 模型参数:5,117,808个(其中5,117,296可训练)

四、实验结果与分析

4.1 准确率对比

模型 验证集准确率
1DCNN 78.7%
LSTM 79.3%
1DCNN-LSTM 80.6%
1DCNN-LSTM-ResNet(本文方法) 81.5%

4.2 验证损失对比

模型 验证损失
LSTM 1.939
1DCNN 1.698
1DCNN-LSTM 1.381
1DCNN-LSTM-ResNet(本文方法) 1.169

4.3 收敛性能

从训练曲线可以观察到:

  • 提出的方法收敛速度显著快于其他方法
  • 在训练集和验证集上都最早达到最高准确率
  • 模型未出现过拟合或欠拟合现象

4.4 混淆矩阵分析

通过对比四种方法的混淆矩阵,可以看到1DCNN-LSTM-ResNet在各个损伤类别上都表现出更好的识别能力,对角线元素(正确分类)的数值普遍更高。


五、结论与展望

5.1 主要结论

  1. 高准确率:提出的1DCNN-LSTM-ResNet方法在基于时序数据的结构损伤状态诊断中表现出高准确率

  2. 方法优越性:实验结果证明该方法优于传统的1DCNN、LSTM及其简单组合

  3. 性能排序:1DCNN < LSTM < 1DCNN-LSTM < 1DCNN-LSTM-ResNet

  4. 克服传统缺陷:该方法有效解决了传统1DCNN和LSTM网络的不足,训练和验证结果表明模型不受欠拟合或过拟合的影响

  5. 实际应用潜力:该方法能高效处理时序数据(SHM领域的主流数据类型),具有重要的实际应用价值

5.2 开源代码

研究者已将源代码开源:https://github.com/Lexuanthangutc/1DCNN-LSTM-ResNet.git

5.3 未来展望

这项研究为SHM领域提供了一种强大的深度学习解决方案。未来的研究方向可能包括:

  • 在更多类型的结构上验证方法的泛化能力
  • 探索更高效的网络架构变体
  • 结合注意力机制进一步提升性能
  • 研究在噪声环境下的鲁棒性
相关推荐
LO嘉嘉VE5 小时前
学习笔记二十九:贝叶斯决策论
人工智能·笔记·学习
猫天意5 小时前
【即插即用模块】AAAI2026 | MHCB+DPA:特征提取+双池化注意力,涨点必备,SCI保二争一!彻底疯狂!!!
网络·人工智能·深度学习·算法·yolo
_codemonster5 小时前
AI大模型入门到实战系列(三)词元(token)和嵌入(embedding)
人工智能·机器学习·embedding
IT_陈寒5 小时前
Java 21新特性实战:这5个改进让我的代码效率提升40%
前端·人工智能·后端
BB_CC_DD5 小时前
CVAT平台安装和半自动标注搭建
深度学习
爱笑的眼睛115 小时前
端到端语音识别系统的前沿实践与深度剖析:从RNN-T到Conformer
java·人工智能·python·ai
zl_vslam5 小时前
SLAM中的非线性优-3D图优化之相对位姿g2o::EdgeSE3Expmap(十)
人工智能·算法·计算机视觉·3d
工业机器视觉设计和实现5 小时前
极简单bpnet对比极简单cnn
人工智能·神经网络·cnn
AI浩5 小时前
基于YOLO的小目标检测增强:一种提升精度与效率的新框架
人工智能·yolo·目标检测
2501_924794905 小时前
告别“创意枯竭周期”:华为云Flexus AI智能体如何重构传统企业营销内容生产力
人工智能·重构·华为云