66、基于长短期记忆 (LSTM) 网络对序列数据进行分类

1、基于长短期记忆 (LSTM) 网络对序列数据进行分类的原理及流程

基于长短期记忆（LSTM）网络对序列数据进行分类是一种常见的深度学习任务，适用于处理具有时间或序列关系的数据。下面是在Matlab中使用LSTM网络对序列数据进行分类的基本原理和流程：

准备数据：
- 确保数据集中包含带有标签的序列数据，例如时间序列数据、文本数据等。
- 将数据进行预处理和归一化，以便输入到LSTM网络中。
构建LSTM网络：
- 在Matlab中，可以使用内置函数 lstmLayer 来构建LSTM层。
- 指定输入数据维度、LSTM单元数量、输出层大小等参数。
- 通过 layers = [sequenceInputLayer(inputSize), lstmLayer(numHiddenUnits), fullyConnectedLayer(numClasses), classificationLayer()] 构建完整的LSTM分类网络。
定义训练选项：
- 设置训练选项，例如学习率、最大迭代次数、小批量大小等。
- 使用 trainingOptions 函数来定义训练选项。
训练网络：
- 使用 trainNetwork 函数来训练构建好的LSTM网络。
- 输入训练数据和标签，并使用定义好的训练选项进行训练。
评估网络性能：
- 使用测试数据评估训练好的网络的性能，可以计算准确率、混淆矩阵等。
- 通过 classify 函数对新数据进行分类预测。
模型调优：
- 可以通过调整LSTM网络结构、训练参数等进行进一步优化模型性能。

在实际的应用中，可以根据具体数据和任务需求对LSTM网络进行调整和优化，以获得更好的分类性能。Matlab提供了丰富的工具和函数来支持LSTM网络的构建、训练和评估，利用这些工具可以更高效地完成序列数据分类任务。

2、基于长短期记忆 (LSTM) 网络对序列数据进行分类说明

使用 LSTM 神经网络对序列数据进行分类,LSTM 神经网络将序列数据输入网络，并根据序列数据的各个时间步进行预测。

3、加载序列数据

1）说明

使用 Waveform 数据集，训练数据包含四种波形的时间序列数据。每个序列有三个通道，且长度不同。

从 WaveformData 加载示例数据。

序列数据是序列的 numObservations×1 元胞数组，其中 numObservations 是序列数。每个序列都是一个 numTimeSteps×-numChannels 数值数组，其中 numTimeSteps 是序列的时间步，numChannels 是序列的通道数。标签数据是 numObservations×1 分类向量。

2）加载数据代码

Matlab 复制代码

load WaveformData

3）绘制部分序列

代码

Matlab 复制代码

numChannels = size(data{1},2);

idx = [3 4 5 12];
figure
tiledlayout(2,2)
for i = 1:4
    nexttile
    stackedplot(data{idx(i)},DisplayLabels="Channel "+string(1:numChannels))
    
    xlabel("Time Step")
    title("Class: " + string(labels(idx(i))))
end

视图效果

4）查看分类

实现代码

Matlab 复制代码

classNames = categories(labels)

classNames = 4×1 cell
    {'Sawtooth'}
    {'Sine'    }
    {'Square'  }
    {'Triangle'}

5）划分数据

说明

使用 trainingPartitions 函数将数据划分为训练集（包含 90% 数据）和测试集（包含其余 10% 数据）

实现代码

Matlab 复制代码

numObservations = numel(data);
[idxTrain,idxTest] = trainingPartitions(numObservations,[0.9 0.1]);
XTrain = data(idxTrain);
TTrain = labels(idxTrain);

XTest = data(idxTest);
TTest = labels(idxTest);

4、准备要填充的数据

1）说明

默认情况下，软件将训练数据拆分成小批量并填充序列，使它们具有相同的长度

2）获取观测值序列长度代码

Matlab 复制代码

numObservations = numel(XTrain);
for i=1:numObservations
    sequence = XTrain{i};
    sequenceLengths(i) = size(sequence,1);
end

3）序列长度排序代码

Matlab 复制代码

[sequenceLengths,idx] = sort(sequenceLengths);
XTrain = XTrain(idx);
TTrain = TTrain(idx);

4）查看序列长度

代码

Matlab 复制代码

figure
bar(sequenceLengths)
xlabel("Sequence")
ylabel("Length")
title("Sorted Data")

视图效果

5、定义 LSTM 神经网络架构

1）说明

将输入大小指定为输入数据的通道数。

指定一个具有 120 个隐藏单元的双向 LSTM 层，并输出序列的最后一个元素。

最后，包括一个输出大小与类的数量匹配的全连接层，后跟一个 softmax 层。

2）实现代码

Matlab 复制代码

numHiddenUnits = 120;
numClasses = 4;

layers = [
    sequenceInputLayer(numChannels)
    bilstmLayer(numHiddenUnits,OutputMode="last")
    fullyConnectedLayer(numClasses)
    softmaxLayer]

layers = 
  4×1 Layer array with layers:

     1   ''   Sequence Input    Sequence input with 3 dimensions
     2   ''   BiLSTM            BiLSTM with 120 hidden units
     3   ''   Fully Connected   4 fully connected layer
     4   ''   Softmax           softmax

6、指定训练选项

1）说明

使用 Adam 求解器进行训练。

进行 200 轮训练。

指定学习率为 0.002。

使用阈值 1 裁剪梯度。

为了保持序列按长度排序，禁用乱序。

在图中显示训练进度并监控准确度。

2）实现代码

Matlab 复制代码

options = trainingOptions("adam", ...
    MaxEpochs=200, ...
    InitialLearnRate=0.002,...
    GradientThreshold=1, ...
    Shuffle="never", ...
    Plots="training-progress", ...
    Metrics="accuracy", ...
    Verbose=false);

7、训练 LSTM 神经网络

1）说明

使用 trainnet 函数训练神经网络

2）实现代码

Matlab 复制代码

net = trainnet(XTrain,TTrain,layers,"crossentropy",options);

3）视图效果

8、测试 LSTM 神经网络

1）对测试数据进行分类，并计算预测的分类准确度。

Matlab 复制代码

numObservationsTest = numel(XTest);
for i=1:numObservationsTest
    sequence = XTest{i};
    sequenceLengthsTest(i) = size(sequence,1);
end

[sequenceLengthsTest,idx] = sort(sequenceLengthsTest);
XTest = XTest(idx);
TTest = TTest(idx);

2）对测试数据进行分类，并计算预测的分类准确度。

Matlab 复制代码

scores = minibatchpredict(net,XTest);
YTest = scores2label(scores,classNames);

3）计算分类准确度

Matlab 复制代码

acc = mean(YTest == TTest)

acc = 0.8700

4）混淆图中显示分类结果

Matlab 复制代码

figure
confusionchart(TTest,YTest)

9、总结

基于长短期记忆（LSTM）网络对序列数据进行分类是一种重要的深度学习任务，适用于处理具有序列关系的数据，如时间序列数据、自然语言处理等。以下是对使用LSTM网络进行序列数据分类的总结：

LSTM网络结构：
- LSTM是一种适用于处理长期依赖问题的循环神经网络（RNN）变种，能够有效地捕捉序列数据中的长期依赖关系。
- LSTM网络包含输入门、遗忘门、输出门等核心部分，通过这些门控机制来控制信息的输入、遗忘和输出。
数据准备：
- 准备带有标签的序列数据，确保数据格式正确且包含标签信息。
- 进行数据预处理和归一化操作，以便于网络训练。
网络构建：
- 使用深度学习框架（如TensorFlow、Pytorch或Matlab）构建LSTM网络，定义输入层、LSTM层、全连接层和输出层。
- 设置网络参数，包括输入维度、LSTM单元个数、输出类别数等。
模型训练：
- 使用标记好的数据集对构建好的LSTM网络进行训练。
- 设置优化器、损失函数和训练参数，如学习率、迭代次数等。
- 调整网络参数以提高模型性能，避免过拟合。
模型评估：
- 使用验证集或测试集对训练好的模型进行评估，计算准确率、精确率、召回率等指标。
- 分析模型在不同类别上的表现，进行结果可视化分析。
模型应用和优化：
- 将训练好的模型用于实际应用中，对新数据进行分类预测。
- 根据实际需求对模型进行调优和优化，如调整网络结构、训练参数或使用模型集成等方法。

综合来看，基于LSTM网络对序列数据进行分类是一种强大的方法，可在许多领域中发挥作用。通过合理设计网络结构、优化数据准备和训练过程，可以有效地构建出具有良好泛化能力的序列数据分类模型。

10、源代码

代码

Matlab 复制代码

%% 基于长短期记忆 (LSTM) 网络对序列数据进行分类
%使用 LSTM 神经网络对序列数据进行分类,LSTM 神经网络将序列数据输入网络，并根据序列数据的各个时间步进行预测。

%% 加载序列数据
%使用 Waveform 数据集，训练数据包含四种波形的时间序列数据。每个序列有三个通道，且长度不同。
%从 WaveformData 加载示例数据。
%序列数据是序列的 numObservations×1 元胞数组，其中 numObservations 是序列数。每个序列都是一个 numTimeSteps×-numChannels 数值数组，其中 numTimeSteps 是序列的时间步，numChannels 是序列的通道数。标签数据是 numObservations×1 分类向量。
load WaveformData 
%绘制部分序列
numChannels = size(data{1},2);

idx = [3 4 5 12];
figure
tiledlayout(2,2)
for i = 1:4
    nexttile
    stackedplot(data{idx(i)},DisplayLabels="Channel "+string(1:numChannels))
    
    xlabel("Time Step")
    title("Class: " + string(labels(idx(i))))
end
%查看类名称
classNames = categories(labels)
%划分数据
%使用 trainingPartitions 函数将数据划分为训练集（包含 90% 数据）和测试集（包含其余 10% 数据），
numObservations = numel(data);
[idxTrain,idxTest] = trainingPartitions(numObservations,[0.9 0.1]);
XTrain = data(idxTrain);
TTrain = labels(idxTrain);

XTest = data(idxTest);
TTest = labels(idxTest);
%% 准备要填充的数据
%默认情况下，软件将训练数据拆分成小批量并填充序列，使它们具有相同的长度
%获取观测值序列长度
numObservations = numel(XTrain);
for i=1:numObservations
    sequence = XTrain{i};
    sequenceLengths(i) = size(sequence,1);
end
%序列长度排序
[sequenceLengths,idx] = sort(sequenceLengths);
XTrain = XTrain(idx);
TTrain = TTrain(idx);
%查看序列长度
figure
bar(sequenceLengths)
xlabel("Sequence")
ylabel("Length")
title("Sorted Data")

%% 定义 LSTM 神经网络架构
%将输入大小指定为输入数据的通道数。
%指定一个具有 120 个隐藏单元的双向 LSTM 层，并输出序列的最后一个元素。
%最后，包括一个输出大小与类的数量匹配的全连接层，后跟一个 softmax 层。
numHiddenUnits = 120;
numClasses = 4;

layers = [
    sequenceInputLayer(numChannels)
    bilstmLayer(numHiddenUnits,OutputMode="last")
    fullyConnectedLayer(numClasses)
    softmaxLayer]
%% 指定训练选项
%使用 Adam 求解器进行训练。
%进行 200 轮训练。
%指定学习率为 0.002。
%使用阈值 1 裁剪梯度。
%为了保持序列按长度排序，禁用乱序。
%在图中显示训练进度并监控准确度。
options = trainingOptions("adam", ...
    MaxEpochs=200, ...
    InitialLearnRate=0.002,...
    GradientThreshold=1, ...
    Shuffle="never", ...
    Plots="training-progress", ...
    Metrics="accuracy", ...
    Verbose=false);
%%  训练 LSTM 神经网络
%使用 trainnet 函数训练神经网络
net = trainnet(XTrain,TTrain,layers,"crossentropy",options);
%% 测试 LSTM 神经网络
%对测试数据进行分类，并计算预测的分类准确度。
numObservationsTest = numel(XTest);
for i=1:numObservationsTest
    sequence = XTest{i};
    sequenceLengthsTest(i) = size(sequence,1);
end

[sequenceLengthsTest,idx] = sort(sequenceLengthsTest);
XTest = XTest(idx);
TTest = TTest(idx);
%对测试数据进行分类，并计算预测的分类准确度。
scores = minibatchpredict(net,XTest);
YTest = scores2label(scores,classNames);
%计算分类准确度
acc = mean(YTest == TTest)
%混淆图中显示分类结果
figure
confusionchart(TTest,YTest)

工程文件

https://download.csdn.net/download/XU157303764/89499744