2022最新版-李宏毅机器学习深度学习课程-P49 GPT的野望

GPT→类似于Transformer Encoder

训练任务:Predict Next Token

使用MASK-attention,不断预测"下一个token"。

可以用GPT生成文章。

How to use GPT?

给出描述和例子

给出前半段,补上后半段

In-context Learning(no GD)

结果

目前看起来状况是,有些任务它还真的学会了 ,举例来说2这个加减法,你给它一个数字加另外一个数字,它真的可以得到,正确的两个数字加起来的结果,但是有些任务,它可能怎麼学都学不会,譬如说一些跟逻辑推理 有关的任务,它的结果就非常非常地惨。

Self-supervesed Learning Beyond Text

CV

Image - SimCLR

Image - BYOL

Speech

训练:

语音也可以做填空题,就把一段声音讯号盖起来,叫机器去猜;

语音也可以预测接下来会出现的内容

Speech GLUE - SUPERB

李宏毅------语音的基准语料库。

相关推荐
风象南5 小时前
普通人用AI加持赚到的第一个100块
人工智能·后端
牛奶6 小时前
2026年大模型怎么选?前端人实用对比
前端·人工智能·ai编程
牛奶6 小时前
前端人为什么要学AI?
前端·人工智能·ai编程
哥布林学者7 小时前
高光谱成像(一)高光谱图像
机器学习·高光谱成像
罗西的思考9 小时前
AI Agent框架探秘:拆解 OpenHands(10)--- Runtime
人工智能·算法·机器学习
冬奇Lab9 小时前
OpenClaw 源码精读(2):Channel & Routing——一条消息如何找到它的 Agent?
人工智能·开源·源码阅读
冬奇Lab9 小时前
一天一个开源项目(第38篇):Claude Code Telegram - 用 Telegram 远程用 Claude Code,随时随地聊项目
人工智能·开源·资讯
格砸11 小时前
从入门到辞职|从ChatGPT到OpenClaw,跟上智能时代的进化
前端·人工智能·后端
可观测性用观测云11 小时前
可观测性 4.0:教系统如何思考
人工智能
sunny86511 小时前
Claude Code 跨会话上下文恢复:从 8 次纠正到 0 次的工程实践
人工智能·开源·github