时间序列预测任务下探索深度学习参数对模型预测性能的影响

时间序列相关的项目在我之前的很多博文中都有涉及,覆盖的数据领域也是比较广泛的,很多任务或者是项目中往往是搭建出来指定的模型之后就基本完成任务了,比较少去通过实验的维度去探索分析不同参数对模型性能的影响,这两天正好有时间也有这么个机会,就想着从这个角度做点事情来对模型产生的结果进行分析。

数据可以使用任意时序的数据都是可以的,本质都是时间序列的数据即可。简单的实例数据如下所示:

参考前面的博文即可知晓如何将时序数据转化为标准的预测数据集,这里就不再赘述了。

这里主要是想从实验角度来分析结果,基础模型构建如下所示,首先考虑的是模型层数产生的影响,这里层数从1叠加至3层:

python 复制代码
def initModel(steps, features):
    """
    模型初始化
    """
    model = Sequential()
    model.add(
        LSTM(
            64,
            activation="relu",
            input_shape=(steps, features),
            kernel_regularizer=l2(0.001),
            return_sequences=False,
        )
    )
    model.add(Dense(features))
    model.compile(optimizer="adam", loss="mse")
    return model

结果如下所示:

接下来是两层的,如下所示:

python 复制代码
def initModel(steps, features):
    """
    模型初始化
    """
    model = Sequential()
    model.add(
        LSTM(
            64,
            activation="relu",
            input_shape=(steps, features),
            kernel_regularizer=l2(0.001),
            return_sequences=True,
        )
    )
    model.add(LSTM(64, activation="relu", kernel_regularizer=l2(0.001)))
    model.add(Dense(features))
    model.compile(optimizer="adam", loss="mse")
    return model

结果如下所示:

最后是3层的,如下所示:

python 复制代码
def initModel(steps, features):
    """
    模型初始化
    """
    model = Sequential()
    model.add(
        LSTM(
            64,
            activation="relu",
            input_shape=(steps, features),
            kernel_regularizer=l2(0.001),
            return_sequences=True,
        )
    )
    model.add(LSTM(64, activation="relu", kernel_regularizer=l2(0.001),return_sequences=True))
    model.add(LSTM(64, activation="relu", kernel_regularizer=l2(0.001)))
    model.add(Dense(features))
    model.compile(optimizer="adam", loss="mse")
    return model

结果如下所示:

直观体验下来是层数的增加并没有带来提升,反而是带来了崩溃式的结果。

接下来想要看下同样结构下,改变参数值带来的变化。

简单的实例如下所示:

python 复制代码
def initModel(steps, features):
    """
    模型初始化
    """
    model = Sequential()
    model.add(
        LSTM(
            128,
            activation="relu",
            input_shape=(steps, features),
            kernel_regularizer=l2(0.001),
            return_sequences=False,
        )
    )
    model.add(Dense(features))
    model.compile(optimizer="adam", loss="mse")
    return model

结果如下所示:

接下来同样的思路改变参数,结果如下所示:

参数的调整能带来一定的改变但是限定在一定的复读内,接下来考虑借鉴之前目标检测里面的方案来改造设计新的结构,借助于搜索技术可以事半功倍,结果如下所示:

可以看到:结果有了质的提升。后面有时间再继续深度研究下。

相关推荐
大数据AI人工智能培训专家培训讲师叶梓9 分钟前
Merlin:面向腹部 CT 的三维视觉语言基础模型
人工智能·计算机视觉·大模型·医疗·ct·视觉大模型·医疗人工智能
AI_Auto21 分钟前
【智能制造】-五大AI场景重塑智能制造
人工智能·制造
ggabb31 分钟前
光芯片技术突破与AI算力应用解析
人工智能
大强同学44 分钟前
Obsidian CLI + Claude Code = 王炸组合
人工智能·windows·ai编程·cli
工业机器视觉设计和实现1 小时前
微分方程的联想
人工智能·神经网络·感想
罗罗攀1 小时前
PyTorch学习笔记|神经网络的损失函数
人工智能·pytorch·笔记·神经网络·学习
枫叶林FYL1 小时前
第9章 因果推理与物理理解
人工智能·算法·机器学习
AIBox3652 小时前
openclaw api 配置排查与接入指南:网关启动、配置文件和模型接入全流程
javascript·人工智能·gpt
LoserChaser2 小时前
OpenClaw 指令大全:分类详解与使用指南
人工智能·ai·语言模型
TDengine (老段)2 小时前
TDengine IDMP 可视化 —— 面板
大数据·数据库·人工智能·物联网·ai·时序数据库·tdengine