打卡第36天:模型可视化以及推理

知识点回顾: 1.三种不同的模型可视化方法:推荐torchinfo打印summary+权重分布可视化

2.进度条功能:手动和自动写法,让打印结果更加美观

3.推理的写法:评估模式

作业:调整模型定义时的超参数,对比下效果。

1.只调整隐藏层参数

python 复制代码
    def __init__(self):  
        super(MLP, self).__init__()  
        self.fc1 = nn.Linear(4, 20)  # 输入层到隐藏层  
        self.relu = nn.ReLU()  
        self.fc2 = nn.Linear(20, 3)  # 隐藏层到输出层

python运行损失并没有下降

2.调整优化器

python 复制代码
optimizer = optim.Adam(model.parameters(), lr=0.001)

3.优化器+隐藏层

@浙大疏锦行

相关推荐
badhope3 小时前
Mobile-Skills:移动端技能可视化的创新实践
开发语言·人工智能·git·智能手机·github
码云数智-园园4 小时前
微服务架构下的分布式事务:在一致性与可用性之间寻找平衡
开发语言
吴佳浩4 小时前
GPU 编号进阶:CUDA\_VISIBLE\_DEVICES、多进程与容器化陷阱
人工智能·pytorch·python
C++ 老炮儿的技术栈4 小时前
volatile使用场景
linux·服务器·c语言·开发语言·c++
hz_zhangrl4 小时前
CCF-GESP 等级考试 2026年3月认证C++一级真题解析
开发语言·c++·gesp·gesp2026年3月·gespc++一级
Liu628884 小时前
C++中的工厂模式高级应用
开发语言·c++·算法
IT猿手5 小时前
基于控制障碍函数的多无人机编队动态避障控制方法研究,MATLAB代码
开发语言·matlab·无人机·openclaw·多无人机动态避障路径规划·无人机编队
全栈凯哥5 小时前
18.Python中的导入类完全指南
python
AI科技星5 小时前
全尺度角速度统一:基于 v ≡ c 的纯推导与验证
c语言·开发语言·人工智能·opencv·算法·机器学习·数据挖掘
sunwenjian8865 小时前
Java进阶——IO 流
java·开发语言·python