2022最新版-李宏毅机器学习深度学习课程-P49 GPT的野望

GPT→类似于Transformer Encoder

训练任务:Predict Next Token

使用MASK-attention,不断预测"下一个token"。

可以用GPT生成文章。

How to use GPT?

给出描述和例子

给出前半段,补上后半段

In-context Learning(no GD)

结果

目前看起来状况是,有些任务它还真的学会了 ,举例来说2这个加减法,你给它一个数字加另外一个数字,它真的可以得到,正确的两个数字加起来的结果,但是有些任务,它可能怎麼学都学不会,譬如说一些跟逻辑推理 有关的任务,它的结果就非常非常地惨。

Self-supervesed Learning Beyond Text

CV

Image - SimCLR

Image - BYOL

Speech

训练:

语音也可以做填空题,就把一段声音讯号盖起来,叫机器去猜;

语音也可以预测接下来会出现的内容

Speech GLUE - SUPERB

李宏毅------语音的基准语料库。

相关推荐
comli_cn几秒前
残差链接(Residual Connection)
人工智能·算法
摸鱼仙人~2 分钟前
在政务公文场景中落地 RAG + Agent:技术难点与系统化解决方案
人工智能·政务
Aaron15888 分钟前
基于VU13P在人工智能高速接口传输上的应用浅析
人工智能·算法·fpga开发·硬件架构·信息与通信·信号处理·基带工程
予枫的编程笔记9 分钟前
【论文解读】DLF:以语言为核心的多模态情感分析新范式 (AAAI 2025)
人工智能·python·算法·机器学习
HyperAI超神经13 分钟前
完整回放|上海创智/TileAI/华为/先进编译实验室/AI9Stars深度拆解 AI 编译器技术实践
人工智能·深度学习·机器学习·开源
大模型真好玩14 分钟前
LangGraph智能体开发设计模式(四)——LangGraph多智能体设计模式:网络架构
人工智能·langchain·agent
北辰alk16 分钟前
RAG嵌入模型选择全攻略:从理论到代码实战
人工智能
Smoothzjc19 分钟前
👉 求你了,别再裸写 fetch 做 AI 流式响应了!90% 的人都在踩这个坑
前端·人工智能·后端
沛沛老爹19 分钟前
Web开发者进阶AI:Agent技能设计模式之迭代分析与上下文聚合实战
前端·人工智能·设计模式
创作者mateo20 分钟前
PyTorch 入门笔记配套【完整练习代码】
人工智能·pytorch·笔记