1、基于长短记忆网络(LSTM)的发动机剩余寿命预测的原理及流程
基于长短期记忆网络(LSTM)的发动机剩余寿命预测是一种常见的机器学习应用,用于分析和预测发动机或其他设备的剩余可用寿命。下面是LSTM用于发动机剩余寿命预测的原理和流程:
-
**数据收集:**首先收集发动机的传感器数据,例如温度、压力、振动等信息,以及与发动机维护记录相关的数据,比如保养历史、维修记录等。
-
**数据预处理:**对收集到的数据进行清洗、去噪、特征提取等预处理工作,以便用于模型训练。同时,将数据按时间顺序进行排序,以便构建时间序列数据集。
-
**构建LSTM模型:**使用深度学习框架如TensorFlow、Keras等,构建LSTM神经网络模型。LSTM适合处理时间序列数据,可以捕捉数据中的长期依赖关系,并在预测序列数据方面表现优异。
-
**数据划分:**将数据集划分为训练集和测试集,通常训练集包含历史数据,而测试集包含待预测的数据。
-
**模型训练:**使用训练集对LSTM模型进行训练,在训练过程中优化模型参数,使模型能够准确地学习数据中的规律和模式。
-
**模型预测:**使用训练好的LSTM模型对测试集中的数据进行预测,得到发动机剩余寿命的预测结果。
-
**评估模型性能:**通过与实际的剩余寿命数据进行比较,评估模型的性能,通常会使用指标如均方根误差(RMSE)等来衡量模型的准确性。
-
**预测与优化:**根据模型的预测结果,制定相应的维护计划,提前预防发动机故障,延长设备的使用寿命。同时,可以不断优化LSTM模型,提高预测准确性和稳定性。
通过以上流程,基于LSTM的发动机剩余寿命预测技术可以帮助企业提高设备维护效率,降低运营成本,提高设备的可靠性和稳定性。
2、基于长短记忆网络(LSTM)的发动机剩余寿命预测说明
使用长短记忆网络(LSTM)依据时间序列数据预测发动机的剩余使用寿命
3、数据集处理
1)说明
创建一个目录来存储涡轮风扇发动机退化仿真数据集
2)代码
Matlab
dataFolder = fullfile(tempdir,"turbofan");
if ~exist(dataFolder,"dir")
mkdir(dataFolder);
end
4、准备训练数据
1)提取数据
实现代码
Matlab
filenamePredictors = fullfile(dataFolder,"train_FD001.txt");
[XTrain,TTrain] = processTurboFanDataTrain(filenamePredictors);
2)删除具有常量值的特征
实现代码
Matlab
XTrainConcatenatedTimesteps = cat(1,XTrain{:});
m = min(XTrainConcatenatedTimesteps,[],1);
M = max(XTrainConcatenatedTimesteps,[],1);
idxConstant = M == m;
for i = 1:numel(XTrain)
XTrain{i}(:,idxConstant) = [];
end
3)查看序列中其余特征的数量
实现代码
Matlab
numFeatures = size(XTrain{1},2)
4)归一化训练预测变量
将训练预测变量归一化为具有零均值和单位方差。
实现代码
Matlab
XTrainConcatenatedTimesteps = cat(1,XTrain{:});
mu = mean(XTrainConcatenatedTimesteps,1);
sig = std(XTrainConcatenatedTimesteps,0,1);
for i = 1:numel(XTrain)
XTrain{i} = (XTrain{i} - mu) ./ sig;
end
5)裁剪响应
更多地从发动机快要出现故障时的序列数据中进行学习,以阈值 150 对响应进行裁剪。这会使网络将具有更高 RUL 值的实例视为等同。
实现代码
Matlab
thr = 150;
for i = 1:numel(TTrain)
TTrain{i}(TTrain{i} > thr) = thr;
end
视图效果
6)准备要填充的数据
均匀划分训练数据的小批量大小,并减少小批量中的填充量
按序列长度对训练数据进行排序
实现代码
Matlab
for i=1:numel(XTrain)
sequence = XTrain{i};
sequenceLengths(i) = size(sequence,1);
end
[sequenceLengths,idx] = sort(sequenceLengths,"descend");
XTrain = XTrain(idx);
TTrain = TTrain(idx);
7)查看排序的序列长度
实现代码
Matlab
figure
bar(sequenceLengths)
xlabel("Sequence")
ylabel("Length")
title("Sorted Data")
视图效果
5、定义网络架构
1)创建网络
创建一个 LSTM 网络,该网络包含一个具有 200 个隐藏单元的 LSTM 层,然后是一个大小为 50 的全连接层和一个丢弃概率为 0.5 的丢弃层。
实现代码
Matlab
numResponses = size(TTrain{1},2);
numHiddenUnits = 200;
layers = [ ...
sequenceInputLayer(numFeatures)
lstmLayer(numHiddenUnits,OutputMode="sequence")
fullyConnectedLayer(50)
dropoutLayer(0.5)
fullyConnectedLayer(numResponses)];
2)指定训练选项
使用求解器 "adam" 以大小为 20 的小批量进行 60 轮训练。
指定学习率为 0.01。防止梯度爆炸,将梯度阈值设置为 1。
使序列保持按长度排序,将 Shuffle 选项设置为 "never"。
实现代码
Matlab
maxEpochs = 60;
miniBatchSize = 20;
options = trainingOptions("adam", ...
MaxEpochs=maxEpochs, ...
MiniBatchSize=miniBatchSize, ...
InitialLearnRate=0.01, ...
GradientThreshold=1, ...
Shuffle="never", ...
Metrics="rmse", ...
Plots="training-progress", ...
Verbose=0);
6、训练网络
使用 trainnet 函数训练神经网络
实现代码
Matlab
net = trainnet(XTrain,TTrain,layers,"mse",options);
视图效果
7、测试网络
1)提取数据
实现代码
Matlab
filenamePredictors = fullfile(dataFolder,"test_FD001.txt");
filenameResponses = fullfile(dataFolder,"RUL_FD001.txt");
[XTest,TTest] = processTurboFanDataTest(filenamePredictors,filenameResponses);
2)裁剪数据
实现代码
Matlab
for i = 1:numel(XTest)
XTest{i}(:,idxConstant) = [];
XTest{i} = (XTest{i} - mu) ./ sig;
TTest{i}(TTest{i} > thr) = thr;
end
3)数据预测
实现代码
Matlab
YTest = minibatchpredict(net,XTest,MiniBatchSize=1,UniformOutput=false);
4)可视化
实现代码
Matlab
idx = randperm(numel(YTest),4);
figure
for i = 1:numel(idx)
subplot(2,2,i)
plot(TTest{idx(i)},"--")
hold on
plot(YTest{idx(i)},".-")
hold off
ylim([0 thr + 25])
title("Test Observation " + idx(i))
xlabel("Time Step")
ylabel("RUL")
end
legend(["Test Data" "Predicted"],Location="southeast")
视图效果
5)可视化预测误差
实现代码
Matlab
for i = 1:numel(TTest)
TTestLast(i) = TTest{i}(end);
YTestLast(i) = YTest{i}(end);
end
figure
rmse = sqrt(mean((YTestLast - TTestLast).^2))
histogram(YTestLast - TTestLast)
title("RMSE = " + rmse)
ylabel("Frequency")
xlabel("Error")
视图效果
8、总结
在 MATLAB 中使用 LSTM 模型进行发动机剩余寿命预测可以通过以下步骤:
-
数据准备:
- 使用 MATLAB 加载发动机传感器数据,包括温度、压力、振动等信息。
- 对数据进行清洗、归一化处理。
- 将数据按时间序列进行整理,构建时间窗口,以便输入 LSTM 模型。
-
创建 LSTM 模型:
- 使用 MATLAB 中的 Neural Network Toolbox 创建 LSTM 模型。
- 定义 LSTM 网络的层数、神经元数量、学习率等超参数。
- 可以通过 MATLAB 中的训练器(trainNetwork)来训练 LSTM 网络。
-
划分数据集:
- 将处理好的数据集划分为训练集、验证集和测试集。
- 训练集用于训练 LSTM 模型,验证集用于调整超参数,测试集用于评估模型性能。
-
模型训练与优化:
- 使用训练集训练 LSTM 模型,在训练过程中监控损失函数并调整超参数。
- 通过验证集来避免过拟合,选择最佳模型。
-
模型预测与评估:
- 使用训练好的 LSTM 模型对测试集数据进行预测,得到发动机剩余寿命的预测值。
- 使用评价指标如均方根误差(RMSE)来评估模型的预测准确性。
-
优化与改进:
- 根据预测结果,优化发动机的维护计划,延长设备的寿命。
- 可以尝试不同的超参数、网络结构等进一步优化 LSTM 模型。
通过以上步骤,在 MATLAB 中使用 LSTM 模型进行发动机剩余寿命预测,可以帮助提高设备维护效率和可靠性。
9、源代码
代码
Matlab
%% 基于长短记忆网络(LSTM)的发动机剩余寿命预测
%使用长短记忆网络(LSTM)依据时间序列数据预测发动机的剩余使用寿命
%% 数据集处理
%创建一个目录来存储涡轮风扇发动机退化仿真数据集
dataFolder = fullfile(tempdir,"turbofan");
if ~exist(dataFolder,"dir")
mkdir(dataFolder);
end
%% 准备训练数据
%使用函数 processTurboFanDataTrain 从 filenamePredictors 中提取数据并返回元胞数组 XTrain 和 TTrain,其中包含训练预测变量和响应序列。
filenamePredictors = fullfile(dataFolder,"train_FD001.txt");
[XTrain,TTrain] = processTurboFanDataTrain(filenamePredictors);
%删除具有常量值的特征
XTrainConcatenatedTimesteps = cat(1,XTrain{:});
m = min(XTrainConcatenatedTimesteps,[],1);
M = max(XTrainConcatenatedTimesteps,[],1);
idxConstant = M == m;
for i = 1:numel(XTrain)
XTrain{i}(:,idxConstant) = [];
end
%查看序列中其余特征的数量
numFeatures = size(XTrain{1},2)
%归一化训练预测变量
%将训练预测变量归一化为具有零均值和单位方差。
XTrainConcatenatedTimesteps = cat(1,XTrain{:});
mu = mean(XTrainConcatenatedTimesteps,1);
sig = std(XTrainConcatenatedTimesteps,0,1);
for i = 1:numel(XTrain)
XTrain{i} = (XTrain{i} - mu) ./ sig;
end
%裁剪响应
%更多地从发动机快要出现故障时的序列数据中进行学习,以阈值 150 对响应进行裁剪。这会使网络将具有更高 RUL 值的实例视为等同。
thr = 150;
for i = 1:numel(TTrain)
TTrain{i}(TTrain{i} > thr) = thr;
end
%准备要填充的数据
%均匀划分训练数据的小批量大小,并减少小批量中的填充量
%按序列长度对训练数据进行排序
for i=1:numel(XTrain)
sequence = XTrain{i};
sequenceLengths(i) = size(sequence,1);
end
[sequenceLengths,idx] = sort(sequenceLengths,"descend");
XTrain = XTrain(idx);
TTrain = TTrain(idx);
%查看排序的序列长度
figure
bar(sequenceLengths)
xlabel("Sequence")
ylabel("Length")
title("Sorted Data")
%% 定义网络架构
%创建一个 LSTM 网络,该网络包含一个具有 200 个隐藏单元的 LSTM 层,然后是一个大小为 50 的全连接层和一个丢弃概率为 0.5 的丢弃层。
numResponses = size(TTrain{1},2);
numHiddenUnits = 200;
layers = [ ...
sequenceInputLayer(numFeatures)
lstmLayer(numHiddenUnits,OutputMode="sequence")
fullyConnectedLayer(50)
dropoutLayer(0.5)
fullyConnectedLayer(numResponses)];
%指定训练选项
%使用求解器 "adam" 以大小为 20 的小批量进行 60 轮训练。
% 指定学习率为 0.01。防止梯度爆炸,将梯度阈值设置为 1。
% 使序列保持按长度排序,将 Shuffle 选项设置为 "never"。
maxEpochs = 60;
miniBatchSize = 20;
options = trainingOptions("adam", ...
MaxEpochs=maxEpochs, ...
MiniBatchSize=miniBatchSize, ...
InitialLearnRate=0.01, ...
GradientThreshold=1, ...
Shuffle="never", ...
Metrics="rmse", ...
Plots="training-progress", ...
Verbose=0);
%% 训练网络
%使用 trainnet 函数训练神经网络
net = trainnet(XTrain,TTrain,layers,"mse",options);
%% 测试网络
%使用函数 processTurboFanDataTest 从 filenamePredictors 和 filenameResponses 中提取数据并返回元胞数组 XTest 和 TTest,其中分别包含测试预测变量和响应序列
filenamePredictors = fullfile(dataFolder,"test_FD001.txt");
filenameResponses = fullfile(dataFolder,"RUL_FD001.txt");
[XTest,TTest] = processTurboFanDataTest(filenamePredictors,filenameResponses);
%使用与训练数据相同的阈值对测试响应进行裁剪
for i = 1:numel(XTest)
XTest{i}(:,idxConstant) = [];
XTest{i} = (XTest{i} - mu) ./ sig;
TTest{i}(TTest{i} > thr) = thr;
end
%使用神经网络进行预测
YTest = minibatchpredict(net,XTest,MiniBatchSize=1,UniformOutput=false);
%可视化一些预测值
idx = randperm(numel(YTest),4);
figure
for i = 1:numel(idx)
subplot(2,2,i)
plot(TTest{idx(i)},"--")
hold on
plot(YTest{idx(i)},".-")
hold off
ylim([0 thr + 25])
title("Test Observation " + idx(i))
xlabel("Time Step")
ylabel("RUL")
end
legend(["Test Data" "Predicted"],Location="southeast")
%直方图中可视化预测误差
for i = 1:numel(TTest)
TTestLast(i) = TTest{i}(end);
YTestLast(i) = YTest{i}(end);
end
figure
rmse = sqrt(mean((YTestLast - TTestLast).^2))
histogram(YTestLast - TTestLast)
title("RMSE = " + rmse)
ylabel("Frequency")
xlabel("Error")