2022最新版-李宏毅机器学习深度学习课程-P49 GPT的野望

GPT→类似于Transformer Encoder

训练任务:Predict Next Token

使用MASK-attention,不断预测"下一个token"。

可以用GPT生成文章。

How to use GPT?

给出描述和例子

给出前半段,补上后半段

In-context Learning(no GD)

结果

目前看起来状况是,有些任务它还真的学会了 ,举例来说2这个加减法,你给它一个数字加另外一个数字,它真的可以得到,正确的两个数字加起来的结果,但是有些任务,它可能怎麼学都学不会,譬如说一些跟逻辑推理 有关的任务,它的结果就非常非常地惨。

Self-supervesed Learning Beyond Text

CV

Image - SimCLR

Image - BYOL

Speech

训练:

语音也可以做填空题,就把一段声音讯号盖起来,叫机器去猜;

语音也可以预测接下来会出现的内容

Speech GLUE - SUPERB

李宏毅------语音的基准语料库。

相关推荐
甲维斯1 天前
Gemini3.5Flash前端是真的强!
前端·人工智能
枫叶林FYL1 天前
【强化学习】3 双系统持续强化学习:快速迁移与元知识整合架构手册
人工智能·机器学习·架构
189228048611 天前
NY382固态MT29F32T08GSLBHL8-24QM:B
大数据·服务器·人工智能·科技·缓存
AI科技星1 天前
哥德巴赫猜想1+1基于平行素数对等腰梯形网格拓扑与素数渐近密度的大偶数满填充完备性证明
人工智能·线性代数·架构·概率论·学习方法
GIS数据转换器1 天前
农村生活污水治理智慧管控平台
大数据·人工智能·分布式·数据分析·生活·智慧城市
常威正在打来福1 天前
frontend-design 入门指南:OpenClaw / Claude Code / Codex 三平台安装教程
人工智能·ai·ai编程
MediaTea1 天前
AI 术语通俗词典:Dropout 层
人工智能
武子康1 天前
调查研究-140 全球机器人产业深度调研报告【02篇】:全球机器人产业格局分析:五个阶段并存与商业化路径 2026
人工智能·ai·机器人·具身智能·智能化
木心术11 天前
Windows系统下MySQL与AI工具集成方案:数据存储与调用实践
人工智能·windows·mysql
a752066281 天前
OpenClaw企业微信渠道配置教程|API模式+长连接+全部授权
人工智能·机器人·企业微信·openclaw部署·小龙虾一键安装