（论文速读）1DCNN-LSTM-ResNet：建筑损伤检测方法

论文题目：A novel approach model design for signal data using 1DCNN combing with LSTM and ResNet for damaged detection problem（将1DCNN与LSTM和ResNet相结合，设计了一种新的信号数据损伤检测方法模型）

会议：Structures （工程技术 2区，小类土木）

摘要：在当今时代，时间序列数据被广泛应用于不同的领域。在结构健康监测(SHM)中，时间序列数据的应用也非常广泛。然而，传统的机器学习(ML)方法，如应用于SHM的人工神经网络，已经不足以有效地处理和准确诊断基于时间相关数据的结构损伤。为了解决这一问题，本研究提出了一种新的深度学习方法，该方法集成了一维卷积神经网络(1DCNN)、长短期记忆网络(LSTM)和残差网络(ResNet)，以提高建筑损伤检测的效率。该方法将1DCNN用于特征提取，LSTM用于识别长期依赖关系，ResNet用于克服深度网络训练中的梯度消失问题。通过SHM领域最全面的数据集之一Z24桥数据集对该方法的有效性进行了评估。结果表明，该方法的准确率为81.5%，显著优于传统的1DCNN(78.7%)、LSTM(79.3%)网络和组合的1DCNNLSTM网络(80.6%)。这强调了整合深度学习技术的有效性。所提出的1DCNN-LSTM-ResNet方法具有较高的精度和效率，在SHM的实际应用中具有较大的潜力。

1DCNN-LSTM-ResNet融合模型详解

引言

在当今数字化时代，基础设施和建筑结构产生的数据量正在急剧增长。如何高效、准确地分析这些数据以诊断结构损伤，已成为结构健康监测（Structural Health Monitoring, SHM）领域的核心挑战。今天，我们来深入解读一篇发表在《Structures》期刊上的重要论文------《A novel approach model design for signal data using 1DCNN combining with LSTM and ResNet for damaged detection problem》。

这篇论文由越南交通运输大学的Le-Xuan Thang、Bui-Tien Thanh和Tran-Ngoc Hoa三位研究者共同完成，提出了一种创新的深度学习方法，将1D卷积神经网络（1DCNN）、长短期记忆网络（LSTM）和残差网络（ResNet）三种架构融合，用于解决结构损伤检测问题。

一、研究背景与问题

1.1 传统方法的困境

在结构健康监测领域，时序数据被广泛应用于监测桥梁、建筑物等基础设施的健康状态。然而，传统的机器学习方法（如人工神经网络）在面对大规模时序数据时，诊断准确性已显不足。这些方法往往只在较小数据集上表现良好，难以应对实际工程中海量传感器数据的处理需求。

1.2 单一深度学习模型的局限性

虽然深度学习技术为SHM领域带来了新的可能，但单一的深度学习模型各有其固有缺陷：

1DCNN（一维卷积神经网络）的局限

擅长识别数据中的局部模式和特征
在捕获长期依赖关系方面表现不佳
当卷积核尺寸不够大时，难以理解序列的全局上下文

LSTM（长短期记忆网络）的局限

训练时间相对较长（由于其循环特性）
复杂的架构容易导致过拟合
顺序计算的特性使其难以在GPU上实现并行化
在某些条件下仍可能出现梯度饱和问题

深层网络的通病

随着网络深度增加，梯度消失和梯度爆炸问题日益严重
深层网络的训练变得极具挑战性

1.3 SHM数据的特殊性

结构健康监测中的传感器数据不仅具有时间维度的依赖性，还存在空间维度的关联性------来自不同位置传感器的数据往往相互关联。这要求模型能够同时处理时空特征，而这正是单一模型难以完美胜任的。

二、创新方法：1DCNN-LSTM-ResNet融合架构

2.1 核心思想

研究者提出的创新点在于：将三种深度学习网络的优势进行有机融合，使其各自的长处能够弥补其他网络的短板。

1DCNN：负责从数据序列中提取局部特征
LSTM ：捕获数据中的长期时序依赖关系
ResNet ：通过残差连接解决深层网络的梯度消失问题

2.2 网络架构详解

整个模型的工作流程可分为两条路径：序列路径 和捷径路径。

序列路径（Sequence Path）

输入层：输入张量 X ∈ R^(N×T×D)，其中N为样本数，T为时间步数，D为输入特征数
初始卷积层：通过1DCNN提取早期特征
复制代码
```
X_conv1 = σ(BN(W_conv1 * X + b_conv1))
```
ResNet块：包含多个卷积层和关键的捷径连接
- 每个卷积操作：X_res = σ(BN(W_conv_i * X + b_conv_i))
- 捷径连接：X_shortcut = W_shortcut * X_previous + b_shortcut
- 合并输出：X_out = ReLU(X_res + X_shortcut)
扩张ResNet块（Dilated ResNet Block）：
- 使用扩张卷积捕获多尺度信息
- 能从更广泛的邻域环境收集特征
- 与常规ResNet块输出合并：X_merged = X_out + X_dilated
LSTM层：处理合并后的张量，捕获时序依赖
复制代码
```
h_t = LSTM(X_merged)
```

捷径路径（Shortcut Path）

这是本研究的一大创新------双重跳跃连接：

第一条捷径：从原始输入建立
复制代码
```
X_shortcut1 = BN(W_s1 * X_input + b_s1)
```
第二条捷径：从常规ResNet块输出建立
复制代码
```
X_shortcut2 = BN(W_s2 * X_merged + b_s2)
```
特征融合：两条捷径与LSTM输出进行拼接
复制代码
```
X_concat = [h_t, X_shortcut1, X_shortcut2]
```

输出层

全局池化：结合全局平均池化和全局最大池化

复制代码

X_avg = Average(X_concat)
X_max = Max(X_concat)
X_pooled = [X_avg, X_max]

全连接层：生成最终预测

复制代码

X_dense1 = σ(W_d1 · X_pooled + b_d1)
X_out = Softmax(W_d2 · X_dense1 + b_d2)

2.3 五大关键创新点

三网融合架构：首次将1DCNN、LSTM和ResNet三种网络有机结合，各取所长
扩张ResNet块：引入扩张卷积，扩大感受野，捕获多尺度信息
双重跳跃连接：提供粗粒度（早期）和细粒度（深层）特征的双重传递
双重全局池化：结合平均池化和最大池化，最大限度保留关键信息
批归一化优化：在序列路径和捷径路径中都集成BN，加速训练并提高稳定性

三、实验验证：Z24桥梁数据集

3.1 数据集介绍

研究者选用了结构健康监测领域最具代表性的数据集之一------Z24桥梁数据集。

Z24桥梁简介：

位置：瑞士伯尔尼区Solothurn附近
类型：预应力混凝土箱梁桥
跨度：主跨30米，两侧各14米
历史：1998年底因修建新铁路而拆除

数据采集：

使用16个加速度传感器
采样频率：100 Hz
每次设置时长约10.9分钟
总共采集65,536个样本

损伤场景：定义了16种不同的损伤状态，包括：

完好状态（标签0、1、7）
桥墩沉降（20mm、40mm、80mm、95mm）
基础倾斜
剥落损伤（12m²、24m²）
滑坡
锚固件损伤（1根柱、2个锚固件、4个锚固件）
预应力筋损伤（2根、4根）

3.2 数据处理

将样本划分为5个时间序列，每个长度8000
每个损伤场景使用9个设置
总样本数：5 × 9 × 16 = 720个样本
训练集/验证集比例：70%/30%（504/216个样本）

3.3 实验环境

操作系统：Windows 11 64位
处理器：AMD Ryzen 5 4600H（12核，约3.0 GHz）
软件：Python 3.9.17 + TensorFlow
优化算法：Adam
训练轮次：100个epoch
模型参数：5,117,808个（其中5,117,296可训练）

四、实验结果与分析

4.1 准确率对比

模型	验证集准确率
1DCNN	78.7%
LSTM	79.3%
1DCNN-LSTM	80.6%
1DCNN-LSTM-ResNet（本文方法）	81.5%

4.2 验证损失对比

模型	验证损失
LSTM	1.939
1DCNN	1.698
1DCNN-LSTM	1.381
1DCNN-LSTM-ResNet（本文方法）	1.169

4.3 收敛性能

从训练曲线可以观察到：

提出的方法收敛速度显著快于其他方法
在训练集和验证集上都最早达到最高准确率
模型未出现过拟合或欠拟合现象

4.4 混淆矩阵分析

通过对比四种方法的混淆矩阵，可以看到1DCNN-LSTM-ResNet在各个损伤类别上都表现出更好的识别能力，对角线元素（正确分类）的数值普遍更高。

五、结论与展望

5.1 主要结论

高准确率：提出的1DCNN-LSTM-ResNet方法在基于时序数据的结构损伤状态诊断中表现出高准确率
方法优越性：实验结果证明该方法优于传统的1DCNN、LSTM及其简单组合
性能排序：1DCNN < LSTM < 1DCNN-LSTM < 1DCNN-LSTM-ResNet
克服传统缺陷：该方法有效解决了传统1DCNN和LSTM网络的不足，训练和验证结果表明模型不受欠拟合或过拟合的影响
实际应用潜力：该方法能高效处理时序数据（SHM领域的主流数据类型），具有重要的实际应用价值

5.2 开源代码

研究者已将源代码开源：https://github.com/Lexuanthangutc/1DCNN-LSTM-ResNet.git

5.3 未来展望

这项研究为SHM领域提供了一种强大的深度学习解决方案。未来的研究方向可能包括：

在更多类型的结构上验证方法的泛化能力
探索更高效的网络架构变体
结合注意力机制进一步提升性能
研究在噪声环境下的鲁棒性