MATLAB环境下基于双向长短时记忆网络的时间序列预测探索

MATLAB环境下简单的基于双向长短时记忆网络的时间序列预测 1997年Schuster提出了双向循环神经网络BiRNN，其由一个正向和反向的循环神经元组成，前向神经元的输出直接作为后向神经元的输入。受到BiRNN的启发，因此学者对LSTM进行改进，提出了双向长短时记忆网络BiLSTM。其在处理序列数据时不仅能访问过去时刻的信息，而且能够访问未来时刻的信息。双向长短时记忆网络能够利用双向信息更好的处理序列数据，从而提高模型的准确率。鉴于双向长短时记忆网络的优势，本项目采用双向长短时记忆网络对若干时间序列进行预测，包括国际航空旅客人数预测、全球冰储量预测、感染水痘人数预测、极紫外光预测、事故预测和240年的太阳黑子预测，运行环境为MATLAB R2021B。 clc; clear; close all; %% ---------------------------- init Variabels ---------------------------- opt.Delays = $1 2 3 4 5 6 7 8 9 10 12 16 20$ ; opt.dataPreprocessMode = 'Data Standardization'; % 'None' 'Data Standardization' 'Data Normalization' opt.learningMethod = 'LSTM'; % 'MLP' 'LSTM' opt.trPercentage = 0.8; % divide data into Test and Train dataset

在时间序列预测的领域里，我们总是在寻找更有效的模型。1997 年 Schuster 提出的双向循环神经网络 BiRNN 可以说是一个重要的里程碑，它由一个正向和反向的循环神经元组成，前向神经元的输出直接作为后向神经元的输入，这一独特的结构让模型对序列的处理有了新的视角。

受到 BiRNN 的启发，学者们对 LSTM（长短期记忆网络）进行改进，提出了双向长短时记忆网络 BiLSTM。这个改进可不得了，BiLSTM 在处理序列数据时，不仅能访问过去时刻的信息，还能够获取未来时刻的信息。这就好比一个人在走路，不仅能回顾走过的路，还能提前看到前方的情况，从而更好地做出决策。这种双向信息的利用，极大地提升了模型处理序列数据的能力，进而提高了模型的准确率。

鉴于双向长短时记忆网络的这些优势，我参与的这个项目决定采用 BiLSTM 对多种时间序列进行预测，像国际航空旅客人数预测、全球冰储量预测、感染水痘人数预测、极紫外光预测、事故预测以及跨度达 240 年的太阳黑子预测，运行环境则选定为 MATLAB R2021B。

下面我们来看看项目开头的一段 MATLAB 代码：

matlab 复制代码

clc; clear; close all;
%% ---------------------------- init Variabels ----------------------------
opt.Delays = [1 2 3 4 5 6 7 8 9 10 12 16 20];
opt.dataPreprocessMode  = 'Data Standardization'; % 'None' 'Data Standardization' 'Data Normalization'
opt.learningMethod      = 'LSTM';                 % 'MLP' 'LSTM'    
opt.trPercentage        = 0.8;                    %  divide data into Test  and Train dataset

clc; clear; close all; 这三行代码简单粗暴，clc 是清空命令行窗口，这样我们后续运行代码输出的结果就不会被之前的内容干扰，看着清爽；clear 是清除工作区中的所有变量，防止之前定义的变量名冲突或者对当前项目产生不必要的影响；close all 则关闭所有打开的图形窗口，避免图形窗口过多占用资源，也让后续绘图更加有序。

再看下面这几行初始化变量的代码。opt.Delays = [1 2 3 4 5 6 7 8 9 10 12 16 20]; 这里定义了一个延迟向量，在时间序列预测中，延迟的选择很关键，它决定了模型能参考到过去哪些时刻的数据，就像刚才说的回顾走过的路，这个向量就规定了能看多远。

opt.dataPreprocessMode = 'Data Standardization'; 这里选择了数据预处理的方式为"数据标准化"，还有其他可选模式注释在后面，数据预处理能让数据更符合模型的"口味"，提升模型的表现，就像做菜前要把食材处理好一样。

opt.learningMethod = 'LSTM'; 明确了使用 LSTM 作为学习方法，当然也可以选择 MLP（多层感知机），不同的学习方法有各自的特点和适用场景，这里基于项目对 BiLSTM 的需求选择了 LSTM。

opt.trPercentage = 0.8; 设定了将数据划分为训练集和测试集的比例，80%的数据用于训练模型，20%用于测试，合理的划分能让模型既学到足够的知识，又能在新数据上检验学习成果。

通过这些初始化设置，我们就为基于 BiLSTM 的时间序列预测在 MATLAB 环境中搭建好了初步的舞台，后续就可以在这个基础上大展身手，进行模型构建、训练和预测等一系列操作啦。