机器学习笔记:李宏毅ChatGPT:生成式学习的两种策略

1 策略1 "各个击破"------autoregressive model

"各个击破"------一个一个生成出来

2 策略2 : "一次到位"------non-autoregressve model

一步到位,全部生成出来

2.1 non-autoregressive model 如何确定长度?

  • 两种策略
    • 策略1:始终生成固定长度(比如100),如果出现end,那么end后面的部分直接扔掉
    • 策略2:首先输出一个数字n,表示之后我们要输出多长,然后输出n长度的句子

3 二者的对比

3.1 生成速度

  • 一般文字相关的任务考虑"各个击破",而影像相关的任务考虑"一次到位"
    • 因为影像每一帧都有很多的像素,如果"各个击破",那么效率太慢了

3.2 生成品质

  • "各个击破"的话是先根据概率生成"老",然后将"老"放入输入,生成下一个字的概率分布,再sample,这样得到"老师"的概率会很大
  • "一次到位"的话同时生成所有字的概率,同时sample,得到有问题的词组的概率会很大

4 二者的结合

4.1 语音合成

4.2 类diffusion model的思路

  • 好多次"一次到位"联合使用
    • 每经过一次"一次到位",图像就会更清楚一点
    • ------>图像会越来越清楚

视频来源:李宏毅讲解生成式AI(大模型,文本,图像)_哔哩哔哩_bilibili

相关推荐
Slow菜鸟2 小时前
AI学习篇(五) | awesome-design-md 使用说明
人工智能·学习
ZC跨境爬虫2 小时前
跟着 MDN 学 HTML day_9:(信件语义标记)
前端·css·笔记·ui·html
狐狐生风2 小时前
LangChain 向量存储:Chroma、FAISS
人工智能·python·学习·langchain·faiss·agentai
狐狐生风3 小时前
LangChain RAG 基础
人工智能·python·学习·langchain·rag·agentai
努力努力再努力FFF5 小时前
医生对AI辅助诊断感兴趣,作为临床人员该怎么了解和学习?
人工智能·学习
OBiO20135 小时前
Cell | 突破AAV载体容量限制!路中华/姜玉武/刘太安团队开发AAVLINK系统实现大基因递送
笔记
智者知已应修善业6 小时前
【51单片机2个按键控制流水灯运行与暂停】2023-9-6
c++·经验分享·笔记·算法·51单片机
sakiko_6 小时前
UIKit学习笔记5-使用UITableView制作聊天页面
笔记·学习·swift·uikit
Alice-YUE7 小时前
【js高频八股】防抖与节流
开发语言·前端·javascript·笔记·学习·ecmascript
北山有鸟8 小时前
修改源码法和插件法
嵌入式硬件·学习