李宏毅机器学习笔记

目录

摘要

Abstract

1.optimizer

[2.network architecture search(NAS)](#2.network architecture search(NAS))


摘要

本篇文章继续学习李宏毅老师2025春季机器学习课程,学习内容是meta learning可训练的参数,如optimizer相关的参数,network架构相关的参数。

1.optimizer

meta learning除了可以学习初始化的参数,还可以学optimizer。在更新参数时我们需要决定learning rate等参数,这些hyper parameter可以用meta learning学出来的。

下图的实验结果是自动根据训练任务学出来的,橙色的是学习出来的optimizer,其他的颜色是其他的方法。训练在MNIST上测试在NIST上结果还不错(第一行的测试结果),但是,训练在一层network上,测试在两层network上依然可以学起来,但是改一下active function就不行了(sigmoid更改为ReLu)。

2.network architecture search(NAS)

meta learning也可以训练network架构,训练network架构研究就叫做network architecture search(NAS)。此时的就是network架构。

如果是network架构做微分就有问题,当 无法算微分时,可以尝试用reinforce learning硬做。具体如果实现呢?我们就需要把当作agent的参数,这个agent的输出就是network架构相关的hyper parameter。接下来需要训练agent让他maximize一个reward,reward直接设置成

下图可以帮助理解NAS在做什么。将agent当作RNN,每次会输出一个与network架构有关的参数,例如先输出filter的数量,在输出filter的高等等,有了这些参数之后就根据这些参数建出一个network,建出这个network之后去训练这个network,之后继续做reinforce learning,可以把这个network在测试资料上的accuracy当作reward去训练agent。

相关推荐
听风吹等浪起几秒前
ResNet模型进阶改进方案完整集合——计算机视觉从业者的结构化性能增强工具箱
人工智能·计算机视觉
环小保1 分钟前
半导体制造的绿色“隐形”战场:废气治理如何“精准狙击”?
大数据·人工智能
珠海西格1 分钟前
1MW光伏项目“四可”装置数据采集类设备具体配置详解
服务器·网络·人工智能·分布式·安全
Chen三变2 分钟前
Pytorch和Tensorflow两大架构如何安装?想在自己的电脑上跑神经网络?如何找到部署自己电脑版本的神经网络工具?人工智能专业的学生集合!!
人工智能·pytorch·tensorflow
爱打代码的小林3 分钟前
OpenCV 实战:基于 SIFT 特征匹配的图像认证系统
人工智能·opencv·计算机视觉
小手智联老徐3 分钟前
在 macOS 上使用 Lima 虚拟机安全部署 OpenClaw:构建你的 AI 隔离沙箱
人工智能·安全·macos·ai智能体·openclaw
测试_AI_一辰3 分钟前
Agent & RAG 测试工程笔记 13:RAG检索层原理拆解:从“看不懂”到手算召回过程
人工智能·笔记·功能测试·算法·ai·ai编程
苦瓜小生5 分钟前
AI-TestHub:我如何从零开发一个智能测试用例生成平台
人工智能·python·测试工具·github·测试用例·fastapi
ooope5 分钟前
OpenClaw、Claude Code 与 Codex 安装及 ppword API 配置全指南
人工智能
weixin_419936927 分钟前
MetaChat 更新:GPT-5.4 Mini / Nano 已上线,国内直接用
人工智能·gpt