李宏毅机器学习笔记

目录

摘要

Abstract

1.optimizer

[2.network architecture search(NAS)](#2.network architecture search(NAS))


摘要

本篇文章继续学习李宏毅老师2025春季机器学习课程,学习内容是meta learning可训练的参数,如optimizer相关的参数,network架构相关的参数。

1.optimizer

meta learning除了可以学习初始化的参数,还可以学optimizer。在更新参数时我们需要决定learning rate等参数,这些hyper parameter可以用meta learning学出来的。

下图的实验结果是自动根据训练任务学出来的,橙色的是学习出来的optimizer,其他的颜色是其他的方法。训练在MNIST上测试在NIST上结果还不错(第一行的测试结果),但是,训练在一层network上,测试在两层network上依然可以学起来,但是改一下active function就不行了(sigmoid更改为ReLu)。

2.network architecture search(NAS)

meta learning也可以训练network架构,训练network架构研究就叫做network architecture search(NAS)。此时的就是network架构。

如果是network架构做微分就有问题,当 无法算微分时,可以尝试用reinforce learning硬做。具体如果实现呢?我们就需要把当作agent的参数,这个agent的输出就是network架构相关的hyper parameter。接下来需要训练agent让他maximize一个reward,reward直接设置成

下图可以帮助理解NAS在做什么。将agent当作RNN,每次会输出一个与network架构有关的参数,例如先输出filter的数量,在输出filter的高等等,有了这些参数之后就根据这些参数建出一个network,建出这个network之后去训练这个network,之后继续做reinforce learning,可以把这个network在测试资料上的accuracy当作reward去训练agent。

相关推荐
逐梦苍穹1 分钟前
我开源了一个Claude Code历史可视化工具:本地Prompt一键浏览、搜索、导出
人工智能·开源·prompt·codex·claudecode
刘国华-平价IT运维课堂5 分钟前
Ubuntu 26.04 LTS 发布,研发与运维需要关注什么?
linux·运维·服务器·人工智能·ubuntu
专注搞钱6 分钟前
半导体行业中基于 LSTM 神经网络的 SPC 异常预测实战
人工智能·rnn·lstm
糖果店的幽灵6 分钟前
Spring AI 从入门到精通-ChatClient你与 AI 对话的终极武器
人工智能·python·spring
蓝速科技7 分钟前
蓝速科技丨立式全面屏 AI 数字人交互一体机落地实战指南
人工智能·科技·交互
暮雪倾风7 分钟前
【AI】CC switch安装与使用教程:告别繁琐配置,解锁 AI 编程 CLI 一键管理
人工智能·chatgpt·claudecode·ccswitch
linge_sun7 分钟前
Sping AI 使用 Ollama 快速搭建本地知识库
java·人工智能·ai编程
Cloud_Shy61810 分钟前
解读《Effective Python 3rd Edition》:从练气到老魔(第四章 Item 25 - 26)
开发语言·人工智能·经验分享·笔记·python·学习方法
KaMeidebaby11 分钟前
卡梅德生物技术快报|抗原如何自己检测?FAdV-4 重组抗原制备与 ELISA 体系技术调试指南
前端·人工智能·物联网·算法·百度
呆呆敲代码的小Y11 分钟前
Understand Anything入门指南: 代码库、知识库 转化为交互式知识图谱
人工智能·ai·知识图谱·知识库·代码库·understand