深度学习周报(6.8~6.14)

目录

摘要

Abstract

[1 QK-LSTM 复现(续上周)](#1 QK-LSTM 复现(续上周))

[1.1 数据预处理](#1.1 数据预处理)

[1.2 基线构建与训练](#1.2 基线构建与训练)

[2 总结](#2 总结)


摘要

本周主要在上周的基础上对基线模型进行了训练,同时对预处理部分进行了完善。

Abstract

This week, building on last week's work, I mainly trained the baseline models and further refined the preprocessing part.

1 QK-LSTM 复现(续上周)

1.1 数据预处理

训练时发现每轮loss均为Nan,如下图:

检查代码发现可能是因为插值无法处理首尾数据,导致数据边界处仍存在部分无效值,于是在原插值处理后加入下面代码:

python 复制代码
df_6months[pollutants] = df_6months[pollutants].ffill().bfill()

问题得以解决,可视化效果与上周类似。

1.2 基线构建与训练

模型代码与上周一样,训练部分首先设置超参数;

python 复制代码
SEQ_LEN = 3         # 序列(论文
INPUT_DIM = 6       # 输入(实际数据)
HIDDEN_DIM = 16     # 隐藏层(论文)
EPOCHS = 20         # 训练轮次(论文)
LR = 1e-3           # 学习率 (论文)
BATCH_SIZE = 1

其次,取数据、构造时间序列并划分训练与测试集;

python 复制代码
# 取数据
X_raw = df_6months_clean[pollutants].values
y_raw = df_6months_clean["AQI"].values.reshape(-1,1)
#归一化
scaler_x = MinMaxScaler()
scaler_y = MinMaxScaler()
X_raw = scaler_x.fit_transform(X_raw)
y_raw = scaler_y.fit_transform(y_raw)

# 时间序列构造(data-污染物特征,target-AQI,seq_len=3-论文参数)
def build_sequences(data, target, seq_len):

    X, y = [], []
    # 遍历所有时间点,取连续seq_len天作为输入,再后一天作为目标
    for i in range(len(data) - seq_len):
        X.append(data[i:i+seq_len])
        y.append(target[i+seq_len])
    return np.array(X), np.array(y)

# 构建序列数据
X, y = build_sequences(X_raw, y_raw, SEQ_LEN)

# 训练测试划分(原文15~19年训练,20年测试)
split = int(len(X) * 5 / 6)
X_train = torch.tensor(X[:split], dtype=torch.float32)
y_train = torch.tensor(y[:split], dtype=torch.float32)
X_test = torch.tensor(X[split:], dtype=torch.float32)
y_test = torch.tensor(y[split:], dtype=torch.float32)

然后进行训练;

python 复制代码
#模型
model = BaselineLSTM(
    input_dim=6,
    hidden_dim=16,
    output_dim=1
)

# 损失与优化
criterion = nn.MSELoss()
optimizer = torch.optim.Adam(model.parameters(), lr=LR)

for epoch in range(EPOCHS):

    model.train()
    optimizer.zero_grad()   # 清空上一次梯度
    output = model(X_train)
    loss = criterion(output, y_train)
    loss.backward()
    optimizer.step()

    print(f"Epoch {epoch+1}/{EPOCHS}, Loss: {loss.item():.6f}")


model.eval()
with torch.no_grad():
    pred = model(X_test)

# 反归一化
pred = scaler_y.inverse_transform(pred.numpy())
y_true = scaler_y.inverse_transform(y_test.numpy())

效果如下:

预测曲线总体比较平滑,而真实曲线波动幅度比较大。

2 总结

下周努力一把把剩下的主体都搞了,同时对比一下两个模型的效果,同时训练的时候为了固定结果可以加一个随机种子。

相关推荐
深度学习机器7 分钟前
Ghostty终端使用体验
人工智能·命令行
Token炼金师7 分钟前
幂律的预言:Kaplan 与 Chinchilla 的算力账本 —— Scaling Laws 与最优配比
人工智能·深度学习·大模型架构·kv cache·scaling laws
云烟成雨TD25 分钟前
LangFlow 1.x 系列【5】可视化编辑页面功能说明
人工智能·python·agent
小宋102128 分钟前
Dify 前后端联调踩坑记录:`/console/api/account/profile` 登录失败排查
人工智能·dify
幸福指北1 小时前
现代化智能终端AShell,是否能够替代你的古法终端?让服务器运维更加高效智能化,快来试试看!
人工智能·ai·终端
女神下凡1 小时前
office系列软件 激活破解(office 2019, 2021, 2024)
人工智能·microsoft
2503_931712481 小时前
京东裸眼3D展示——30分钟建模绒感褶皱光泽都能还原
人工智能
星马梦缘1 小时前
机器学习与模式识别 第八章 MAP与偏方差 考点压缩
人工智能·机器学习·map·岭回归·mle·双重下降
一楼的猫1 小时前
AI写作合规技术方案:平台检测机制分析与规避策略
人工智能·学习·机器学习·ai写作
阿拉斯攀登2 小时前
Agent 核心架构:思考-行动-观察循环(ReAct)
人工智能·ai·agent·react