李宏毅机器学习笔记

目录

摘要

Abstract

1.optimizer

[2.network architecture search(NAS)](#2.network architecture search(NAS))


摘要

本篇文章继续学习李宏毅老师2025春季机器学习课程,学习内容是meta learning可训练的参数,如optimizer相关的参数,network架构相关的参数。

1.optimizer

meta learning除了可以学习初始化的参数,还可以学optimizer。在更新参数时我们需要决定learning rate等参数,这些hyper parameter可以用meta learning学出来的。

下图的实验结果是自动根据训练任务学出来的,橙色的是学习出来的optimizer,其他的颜色是其他的方法。训练在MNIST上测试在NIST上结果还不错(第一行的测试结果),但是,训练在一层network上,测试在两层network上依然可以学起来,但是改一下active function就不行了(sigmoid更改为ReLu)。

2.network architecture search(NAS)

meta learning也可以训练network架构,训练network架构研究就叫做network architecture search(NAS)。此时的就是network架构。

如果是network架构做微分就有问题,当 无法算微分时,可以尝试用reinforce learning硬做。具体如果实现呢?我们就需要把当作agent的参数,这个agent的输出就是network架构相关的hyper parameter。接下来需要训练agent让他maximize一个reward,reward直接设置成

下图可以帮助理解NAS在做什么。将agent当作RNN,每次会输出一个与network架构有关的参数,例如先输出filter的数量,在输出filter的高等等,有了这些参数之后就根据这些参数建出一个network,建出这个network之后去训练这个network,之后继续做reinforce learning,可以把这个network在测试资料上的accuracy当作reward去训练agent。

相关推荐
Ralph_Salar14 小时前
从0到1搭建AI智能支付风控助手Stage1-RAG知识库升级 — 元数据让检索更精准
人工智能
武子康14 小时前
调查研究-199 MCP Zero-Touch OAuth:为什么它是 MCP 进入企业生产的关键门槛?
人工智能·agent·mcp
冬奇Lab14 小时前
每日一个开源项目(第144篇):ai-website-cloner-template - 一条命令、多 Agent 并行,把任意网站逆向成 Next.js 代码
前端·人工智能·开源
冬奇Lab14 小时前
AI 原生组织不是买工具,而是让等待消失
人工智能·工作流引擎
半个落月14 小时前
从数据集划分理解大模型的数据工程
人工智能
用户82997929439315 小时前
一文带你彻底搞懂claude code中的上下文压缩
人工智能
IT_陈寒15 小时前
Vue的这个响应式陷阱让我熬到凌晨三点
前端·人工智能·后端
冬奇Lab1 天前
Workflow 系列(01):基础理论——三种执行模型与 Anthropic 5 种模式
人工智能·agent·工作流引擎
冬奇Lab1 天前
每日一个开源项目(第143篇):page-agent - 纯 JS 的网页 GUI Agent,无需截图、无需插件、无需后端
前端·人工智能·agent
程序员cxuan1 天前
虽迟但到!GPT-5.6 终于来了!
人工智能·后端·程序员