机器学习笔记:李宏毅ChatGPT:生成式学习的两种策略

1 策略1 "各个击破"------autoregressive model

"各个击破"------一个一个生成出来

2 策略2 : "一次到位"------non-autoregressve model

一步到位,全部生成出来

2.1 non-autoregressive model 如何确定长度?

  • 两种策略
    • 策略1:始终生成固定长度(比如100),如果出现end,那么end后面的部分直接扔掉
    • 策略2:首先输出一个数字n,表示之后我们要输出多长,然后输出n长度的句子

3 二者的对比

3.1 生成速度

  • 一般文字相关的任务考虑"各个击破",而影像相关的任务考虑"一次到位"
    • 因为影像每一帧都有很多的像素,如果"各个击破",那么效率太慢了

3.2 生成品质

  • "各个击破"的话是先根据概率生成"老",然后将"老"放入输入,生成下一个字的概率分布,再sample,这样得到"老师"的概率会很大
  • "一次到位"的话同时生成所有字的概率,同时sample,得到有问题的词组的概率会很大

4 二者的结合

4.1 语音合成

4.2 类diffusion model的思路

  • 好多次"一次到位"联合使用
    • 每经过一次"一次到位",图像就会更清楚一点
    • ------>图像会越来越清楚

视频来源:李宏毅讲解生成式AI(大模型,文本,图像)_哔哩哔哩_bilibili

相关推荐
love530love5 分钟前
【PyCharm必会基础】正确移除解释器及虚拟环境(以 Poetry 为例 )
开发语言·ide·windows·笔记·python·pycharm
凌辰揽月7 分钟前
Web后端基础(基础知识)
java·开发语言·前端·数据库·学习·算法
普宁彭于晏1 小时前
元素水平垂直居中的方法
前端·css·笔记·css3
whoarethenext2 小时前
C++ OpenCV 学习路线图
c++·opencv·学习
m0_637146932 小时前
计算机网络基础总结:TCP/IP 模型、TCP vs UDP、DNS 查询过程
笔记·tcp/ip·计算机网络
恰薯条的屑海鸥2 小时前
零基础在实践中学习网络安全-皮卡丘靶场(第十四期-XXE模块)
网络·学习·安全·web安全·渗透测试
Lester_11012 小时前
嵌入式学习笔记 - freeRTOS vTaskPlaceOnEventList()函数解析
笔记·学习
moxiaoran57533 小时前
uni-app学习笔记二十三--交互反馈showToast用法
笔记·学习·uni-app
scdifsn10 小时前
动手学深度学习12.7. 参数服务器-笔记&练习(PyTorch)
pytorch·笔记·深度学习·分布式计算·数据并行·参数服务器
恰薯条的屑海鸥11 小时前
零基础在实践中学习网络安全-皮卡丘靶场(第十六期-SSRF模块)
数据库·学习·安全·web安全·渗透测试·网络安全学习