【极速版 -- 大模型入门到进阶】快速了解大型语言模型

文章目录

    • [🌊 大模型作为一种生成式人工智慧,厉害在哪儿?-> 通用能力](#🌊 大模型作为一种生成式人工智慧,厉害在哪儿?-> 通用能力)
    • [🌊 LLM 如何生成输出:简而言之就是文字接龙](#🌊 LLM 如何生成输出:简而言之就是文字接龙)
    • [🌊 GPT 之前 ...:模型规模和数据规模概览](#🌊 GPT 之前 ...:模型规模和数据规模概览)
    • [🌊 ChatGPT 有三个训练阶段:预训练、督导式学习、强化学习](#🌊 ChatGPT 有三个训练阶段:预训练、督导式学习、强化学习)
    • [🌊 ChatGPT 使用:人类向 chatgpt 靠近](#🌊 ChatGPT 使用:人类向 chatgpt 靠近)
    • [🌊 ChatGPT 跟真实环境互动 (例如可以操控机器臂)](#🌊 ChatGPT 跟真实环境互动 (例如可以操控机器臂))

🌊 大模型作为一种生成式人工智慧,厉害在哪儿?-> 通用能力

🌊 LLM 如何生成输出:简而言之就是文字接龙

🌊 GPT 之前 ...:模型规模和数据规模概览

  • 之前都是从网络上各类文字资料学习 ...
  • 之后开启下一个阶段:【督导式学习】由人类告诉 GPT 我们想要的答案是什么,这一阶段并不需要大量资料 (上万的资料就可以)

🌊 ChatGPT 有三个训练阶段:预训练、督导式学习、强化学习

  • Reinforcement Learning from Human Feedback (RLHF):原理复杂概念简单;模型要有一定能力(偶有佳作),进入 RLHF才有意义

🌊 ChatGPT 使用:人类向 chatgpt 靠近

  • 讲清需求

  • 提供足够的信息,也可以上传档案

  • 提供范例: in-context learning (注意,是没有训练,没有改变参数的)

  • 鼓励 chatgpt 想一想 (例如使用下面的魔法咒语表 🔮 Chain of Thought (CoT))

  • 使用外挂 (例如 +搜索引擎, 具体怎么学习呢 -> 参考:https://youtu.be/ZlD220t Mpl?feature=shared)

  • 拆解任务后执行 (可以让 chatgpt 自己拆解)

  • 让它反思 (例如:告诉它请检查上述答案是否正确)

🌊 ChatGPT 跟真实环境互动 (例如可以操控机器臂)


参考资料:面向每个人的生成式AI, 【李宏毅 LLM 大模型】

相关推荐
语戚1 分钟前
Stable Diffusion 核心模块深度拆解:CLIP、U-Net 与 VAE 原理全解析
人工智能·ai·stable diffusion·aigc·模型
枫叶林FYL1 分钟前
【自然语言处理 NLP】8.3 长文本推理评估与针在大海堆任务
人工智能·算法
TDengine (老段)2 分钟前
TDengine IDMP 事件 —— 事件模板
大数据·数据库·人工智能·时序数据库·tdengine·涛思数据
skywalk81632 分钟前
DuMate帮着在Windows10 编译安装Whisper-CPP
人工智能·whisper
Sonhhxg_柒5 分钟前
【LLM】DeepAgents实战教程及DeepResearch代码分析
人工智能·深度学习·语言模型
黑金IT6 分钟前
*Qwen3-V2**与 **Gemini 4o**区别
人工智能·prompt
海兰9 分钟前
【实战】MemPalace 完整安装与使用指南
人工智能·openclaw
weixin_408099679 分钟前
【保姆级教程】按键精灵调用 OCR 文字识别 API(从0到1完整实战 + 可运行脚本)
java·前端·人工智能·后端·ocr·api·按键精灵
CoderJia程序员甲9 分钟前
GitHub 热榜项目 - 日榜(2026-04-10)
人工智能·ai·大模型·github·ai教程
Daydream.V9 分钟前
语言转换方法——CBOW
人工智能·语言模型·word2vec·词向量·cbow·神经语言模型