时间序列预测任务下探索深度学习参数对模型预测性能的影响

时间序列相关的项目在我之前的很多博文中都有涉及,覆盖的数据领域也是比较广泛的,很多任务或者是项目中往往是搭建出来指定的模型之后就基本完成任务了,比较少去通过实验的维度去探索分析不同参数对模型性能的影响,这两天正好有时间也有这么个机会,就想着从这个角度做点事情来对模型产生的结果进行分析。

数据可以使用任意时序的数据都是可以的,本质都是时间序列的数据即可。简单的实例数据如下所示:

参考前面的博文即可知晓如何将时序数据转化为标准的预测数据集,这里就不再赘述了。

这里主要是想从实验角度来分析结果,基础模型构建如下所示,首先考虑的是模型层数产生的影响,这里层数从1叠加至3层:

python 复制代码
def initModel(steps, features):
    """
    模型初始化
    """
    model = Sequential()
    model.add(
        LSTM(
            64,
            activation="relu",
            input_shape=(steps, features),
            kernel_regularizer=l2(0.001),
            return_sequences=False,
        )
    )
    model.add(Dense(features))
    model.compile(optimizer="adam", loss="mse")
    return model

结果如下所示:

接下来是两层的,如下所示:

python 复制代码
def initModel(steps, features):
    """
    模型初始化
    """
    model = Sequential()
    model.add(
        LSTM(
            64,
            activation="relu",
            input_shape=(steps, features),
            kernel_regularizer=l2(0.001),
            return_sequences=True,
        )
    )
    model.add(LSTM(64, activation="relu", kernel_regularizer=l2(0.001)))
    model.add(Dense(features))
    model.compile(optimizer="adam", loss="mse")
    return model

结果如下所示:

最后是3层的,如下所示:

python 复制代码
def initModel(steps, features):
    """
    模型初始化
    """
    model = Sequential()
    model.add(
        LSTM(
            64,
            activation="relu",
            input_shape=(steps, features),
            kernel_regularizer=l2(0.001),
            return_sequences=True,
        )
    )
    model.add(LSTM(64, activation="relu", kernel_regularizer=l2(0.001),return_sequences=True))
    model.add(LSTM(64, activation="relu", kernel_regularizer=l2(0.001)))
    model.add(Dense(features))
    model.compile(optimizer="adam", loss="mse")
    return model

结果如下所示:

直观体验下来是层数的增加并没有带来提升,反而是带来了崩溃式的结果。

接下来想要看下同样结构下,改变参数值带来的变化。

简单的实例如下所示:

python 复制代码
def initModel(steps, features):
    """
    模型初始化
    """
    model = Sequential()
    model.add(
        LSTM(
            128,
            activation="relu",
            input_shape=(steps, features),
            kernel_regularizer=l2(0.001),
            return_sequences=False,
        )
    )
    model.add(Dense(features))
    model.compile(optimizer="adam", loss="mse")
    return model

结果如下所示:

接下来同样的思路改变参数,结果如下所示:

参数的调整能带来一定的改变但是限定在一定的复读内,接下来考虑借鉴之前目标检测里面的方案来改造设计新的结构,借助于搜索技术可以事半功倍,结果如下所示:

可以看到:结果有了质的提升。后面有时间再继续深度研究下。

相关推荐
比尔盖茨的大脑3 分钟前
AI Agent 架构设计:从 ReAct 到 Multi-Agent 系统
前端·人工智能·全栈
数据智能老司机9 分钟前
PyTorch 深度学习——它始于一个张量
pytorch·深度学习
后端小肥肠37 分钟前
OpenClaw 实战|多 Agent 打通小红书:数据收集 + 笔记编写 + 自动发布一步到位
人工智能·aigc·agent
银河系搭车客指南1 小时前
OpenClaw 多 Agent 实战指南:Multi-Agent Routing 与 Sub-Agents 的正确打开方式
人工智能
手机不死我是天子1 小时前
拆解大模型二:Transformer 最核心的设计,其实你高中就学过
人工智能·llm
gustt1 小时前
MCP协议进阶:构建多工具Agent实现智能查询与浏览器交互
人工智能·agent·mcp
Halo咯咯1 小时前
Claude Code 的工程哲学:缓存与工具设计的真实教训 | 经验分享
人工智能
风象南2 小时前
最适合新手先装的 20 个 OpenClaw Skills 来了!
人工智能
小兵张健13 小时前
35岁程序员的春天来了
人工智能
大怪v13 小时前
AI抢饭?前端佬:我要验牌!
前端·人工智能·程序员