机器学习笔记:李宏毅ChatGPT:生成式学习的两种策略

1 策略1 "各个击破"------autoregressive model

"各个击破"------一个一个生成出来

2 策略2 : "一次到位"------non-autoregressve model

一步到位,全部生成出来

2.1 non-autoregressive model 如何确定长度?

  • 两种策略
    • 策略1:始终生成固定长度(比如100),如果出现end,那么end后面的部分直接扔掉
    • 策略2:首先输出一个数字n,表示之后我们要输出多长,然后输出n长度的句子

3 二者的对比

3.1 生成速度

  • 一般文字相关的任务考虑"各个击破",而影像相关的任务考虑"一次到位"
    • 因为影像每一帧都有很多的像素,如果"各个击破",那么效率太慢了

3.2 生成品质

  • "各个击破"的话是先根据概率生成"老",然后将"老"放入输入,生成下一个字的概率分布,再sample,这样得到"老师"的概率会很大
  • "一次到位"的话同时生成所有字的概率,同时sample,得到有问题的词组的概率会很大

4 二者的结合

4.1 语音合成

4.2 类diffusion model的思路

  • 好多次"一次到位"联合使用
    • 每经过一次"一次到位",图像就会更清楚一点
    • ------>图像会越来越清楚

视频来源:李宏毅讲解生成式AI(大模型,文本,图像)_哔哩哔哩_bilibili

相关推荐
驱动起爆大师x_x11 分钟前
《Ubuntu20.04环境下的ROS进阶学习7》
linux·笔记·学习·机器人·自动驾驶
fzyz1231 小时前
手搓一个Eval#Datawhale组队学习大模型任务Task4
人工智能·深度学习·学习·机器学习
hunteritself1 小时前
ChatGPT实时语音将于本周向免费用户推出:OpenAI DevDay 2024详细解读
人工智能·gpt·算法·chatgpt·openai·语音识别
狐571 小时前
横排文字、图层蒙版-1(2024年09月30日)
笔记·学习
ker-ge1 小时前
笔记 - 高分辨率下部分软件应用字体太小
笔记
-特立独行的猪-1 小时前
SystemC学习(一)——环境安装
学习
wusam1 小时前
螺狮壳里做道场:老破机搭建的私人数据中心---Centos下docker学习02(yum源切换及docker安装配置)
学习·docker·centos
muls12 小时前
考研笔记之操作系统(三)- 存储管理
笔记·考研
limengshi1383922 小时前
通信工程学习:什么是DQDB分布式队列双总线
网络·学习·信息与通信
时凯凯凯凯2 小时前
git初级使用学习(图文)
git·学习