【极速版 -- 大模型入门到进阶】快速了解大型语言模型

文章目录

    • [🌊 大模型作为一种生成式人工智慧,厉害在哪儿?-> 通用能力](#🌊 大模型作为一种生成式人工智慧,厉害在哪儿?-> 通用能力)
    • [🌊 LLM 如何生成输出:简而言之就是文字接龙](#🌊 LLM 如何生成输出:简而言之就是文字接龙)
    • [🌊 GPT 之前 ...:模型规模和数据规模概览](#🌊 GPT 之前 ...:模型规模和数据规模概览)
    • [🌊 ChatGPT 有三个训练阶段:预训练、督导式学习、强化学习](#🌊 ChatGPT 有三个训练阶段:预训练、督导式学习、强化学习)
    • [🌊 ChatGPT 使用:人类向 chatgpt 靠近](#🌊 ChatGPT 使用:人类向 chatgpt 靠近)
    • [🌊 ChatGPT 跟真实环境互动 (例如可以操控机器臂)](#🌊 ChatGPT 跟真实环境互动 (例如可以操控机器臂))

🌊 大模型作为一种生成式人工智慧,厉害在哪儿?-> 通用能力

🌊 LLM 如何生成输出:简而言之就是文字接龙

🌊 GPT 之前 ...:模型规模和数据规模概览

  • 之前都是从网络上各类文字资料学习 ...
  • 之后开启下一个阶段:【督导式学习】由人类告诉 GPT 我们想要的答案是什么,这一阶段并不需要大量资料 (上万的资料就可以)

🌊 ChatGPT 有三个训练阶段:预训练、督导式学习、强化学习

  • Reinforcement Learning from Human Feedback (RLHF):原理复杂概念简单;模型要有一定能力(偶有佳作),进入 RLHF才有意义

🌊 ChatGPT 使用:人类向 chatgpt 靠近

  • 讲清需求

  • 提供足够的信息,也可以上传档案

  • 提供范例: in-context learning (注意,是没有训练,没有改变参数的)

  • 鼓励 chatgpt 想一想 (例如使用下面的魔法咒语表 🔮 Chain of Thought (CoT))

  • 使用外挂 (例如 +搜索引擎, 具体怎么学习呢 -> 参考:https://youtu.be/ZlD220t Mpl?feature=shared)

  • 拆解任务后执行 (可以让 chatgpt 自己拆解)

  • 让它反思 (例如:告诉它请检查上述答案是否正确)

🌊 ChatGPT 跟真实环境互动 (例如可以操控机器臂)


参考资料:面向每个人的生成式AI, 【李宏毅 LLM 大模型】

相关推荐
火山引擎开发者社区3 小时前
没有长期记忆,Agent 谈何持续进化?一图看懂火山 Mem0:解锁 Agent 持续学习与进化之路
人工智能
冬奇Lab7 小时前
Workflow 系列(06):安全——跨步骤注入传播与四层防御
人工智能·工作流引擎
冬奇Lab7 小时前
每日一个开源项目(第149篇):RAG-Anything - 把图片、表格、公式当成一等公民的多模态 RAG 框架
人工智能·开源
米小虾7 小时前
AI Agent 安全实战指南:当智能体开始"不听话",开发者该如何应对?
人工智能·安全·agent
IT_陈寒9 小时前
Vite的热更新突然不香了,排查三小时差点砸键盘
前端·人工智能·后端
阿里云大数据AI技术11 小时前
构建高转化海外电商搜索:阿里云OpenSearch行业算法版的全链路智能优化策略实战
人工智能·搜索引擎
Awu122711 小时前
⚡从零开发 Agent CLI(五)实现一个可治理、可扩展的工具系统
前端·人工智能·claude
字节跳动视频云技术团队11 小时前
让 Agent 成为音视频工作台:AI MediaKit CLI + Skill 发布
人工智能·音视频开发
魏祖潇11 小时前
framework 整合实战——DDD/TDD/SDD 三件套在 framework 仓的真实落地
人工智能·后端