2022最新版-李宏毅机器学习深度学习课程-P49 GPT的野望

GPT→类似于Transformer Encoder

训练任务:Predict Next Token

使用MASK-attention,不断预测"下一个token"。

可以用GPT生成文章。

How to use GPT?

给出描述和例子

给出前半段,补上后半段

In-context Learning(no GD)

结果

目前看起来状况是,有些任务它还真的学会了 ,举例来说2这个加减法,你给它一个数字加另外一个数字,它真的可以得到,正确的两个数字加起来的结果,但是有些任务,它可能怎麼学都学不会,譬如说一些跟逻辑推理 有关的任务,它的结果就非常非常地惨。

Self-supervesed Learning Beyond Text

CV

Image - SimCLR

Image - BYOL

Speech

训练:

语音也可以做填空题,就把一段声音讯号盖起来,叫机器去猜;

语音也可以预测接下来会出现的内容

Speech GLUE - SUPERB

李宏毅------语音的基准语料库。

相关推荐
KY_chenzhao9 分钟前
ChatGPT与DeepSeek在科研论文撰写中的整体科研流程与案例解析
人工智能·机器学习·chatgpt·论文·科研·deepseek
不爱吃于先生17 分钟前
生成对抗网络(Generative Adversarial Nets,GAN)
人工智能·神经网络·生成对抗网络
cxr82842 分钟前
基于Playwright的浏览器自动化MCP服务
人工智能·自动化·大语言模型·mcp
PPIO派欧云1 小时前
PPIO X OWL:一键开启任务自动化的高效革命
运维·人工智能·自动化·github·api·教程·ppio派欧云
奋斗者1号1 小时前
数值数据标准化:机器学习中的关键预处理技术
人工智能·机器学习
kyle~1 小时前
深度学习---框架流程
人工智能·深度学习
miracletiger1 小时前
uv 新的包管理工具总结
linux·人工智能·python
视觉AI1 小时前
SiamMask原理详解:从SiamFC到SiamRPN++,再到多任务分支设计
人工智能·目标检测·计算机视觉·目标分割
Olafur_zbj1 小时前
【EDA】EDA中聚类(Clustering)和划分(Partitioning)的应用场景
机器学习·数据挖掘·聚类
视觉&物联智能1 小时前
【杂谈】-人工智能驱动的网络安全威胁:新一代网络钓鱼
网络·人工智能·web安全·网络安全·安全威胁分析