2023春季李宏毅机器学习笔记 01 :正确认识 ChatGPT

资料

一、对Chatgpt的误解

常见误解

  1. 给出的回答不是已经准备好的(罐头回应×)
  2. 不是网络上搜索得出的答案(甚至有很多幻想出来的答案)

原理

二、预训练

ChatGPT:chat Generative Pre-trained Transformer

关键技术:

  • Pre-train(预训练)=Self supervised Leaarning(自督导式学习)
  • Foundation Model:基石模型
  • Fintune:微调

三、ChatGPT带来的研究问题

  1. 如何精准提出需求?
    目前使用的方法:Prompting
    创新点:有没有比人工尝试更加系统性的方法?
  2. 如何更正错误?
    目前没有较好的解决方法
    创新点:新研究题目Neural Editing
  3. 甄别AI生成的内容
  4. 泄露秘密、隐私信息
    创新点:新的研究题目:Machine Unlearning

四、文字冒险游戏

五、ChatGPT是怎么练成的?

ChatGPT的"兄弟":InstructGPT,论文地址:https://arxiv.org/abs/2203.02155

ChatGPT学习四阶段

  1. 学习文字接龙

    不需要人工标注,在网络上收集语句,对输入句子(字)后面可以接的字进行概率统计,每次输出高概率的字(每一次输出都不同)

  2. 人类老师引导文字接龙方向

    人来思考问题,并人工提供答案(不需要很多,目的只是为了让GPT知道人们希望得到的答案)

  3. 模仿人类老师的喜好

    训练Teacher Model让希望输出的答案的"分数"大于其他输出

  4. 用增强式学习向模拟老师学习

六、延伸学习

分类

回归

相关推荐
新智元2 分钟前
Meta没做的,英伟达做了!全新架构吞吐量狂飙6倍,20万亿Token训练
人工智能·openai
新智元3 分钟前
Hinton 预言成真!AI 接管美国一半白领,牛津哈佛扎堆转行做技工
人工智能·openai
aneasystone本尊14 分钟前
学习 Coze Studio 的知识库入库逻辑
人工智能
然我15 分钟前
从 “只会聊天” 到 “能办实事”:OpenAI Function Call 彻底重构 AI 交互逻辑(附完整接入指南)
前端·javascript·人工智能
岁月宁静22 分钟前
软件开发核心流程全景解析 —— 基于 AI 多模态项目实践
前端·人工智能·后端
wangjiaocheng23 分钟前
软件功能分解输入处理输出递归嵌套模型
人工智能
G等你下课24 分钟前
Function call
前端·人工智能
岁月宁静25 分钟前
MCP 协议应用场景 —— Cursor 连接 Master Go AI
前端·vue.js·人工智能
柠檬味拥抱27 分钟前
融合NLU与NLG的AI Agent语言交互机制研究
人工智能
wydaicls30 分钟前
用函数实现方程函数解题
人工智能·算法·机器学习