【极速版 -- 大模型入门到进阶】快速了解大型语言模型

文章目录

    • [🌊 大模型作为一种生成式人工智慧,厉害在哪儿?-> 通用能力](#🌊 大模型作为一种生成式人工智慧,厉害在哪儿?-> 通用能力)
    • [🌊 LLM 如何生成输出:简而言之就是文字接龙](#🌊 LLM 如何生成输出:简而言之就是文字接龙)
    • [🌊 GPT 之前 ...:模型规模和数据规模概览](#🌊 GPT 之前 ...:模型规模和数据规模概览)
    • [🌊 ChatGPT 有三个训练阶段:预训练、督导式学习、强化学习](#🌊 ChatGPT 有三个训练阶段:预训练、督导式学习、强化学习)
    • [🌊 ChatGPT 使用:人类向 chatgpt 靠近](#🌊 ChatGPT 使用:人类向 chatgpt 靠近)
    • [🌊 ChatGPT 跟真实环境互动 (例如可以操控机器臂)](#🌊 ChatGPT 跟真实环境互动 (例如可以操控机器臂))

🌊 大模型作为一种生成式人工智慧,厉害在哪儿?-> 通用能力

🌊 LLM 如何生成输出:简而言之就是文字接龙

🌊 GPT 之前 ...:模型规模和数据规模概览

  • 之前都是从网络上各类文字资料学习 ...
  • 之后开启下一个阶段:【督导式学习】由人类告诉 GPT 我们想要的答案是什么,这一阶段并不需要大量资料 (上万的资料就可以)

🌊 ChatGPT 有三个训练阶段:预训练、督导式学习、强化学习

  • Reinforcement Learning from Human Feedback (RLHF):原理复杂概念简单;模型要有一定能力(偶有佳作),进入 RLHF才有意义

🌊 ChatGPT 使用:人类向 chatgpt 靠近

  • 讲清需求

  • 提供足够的信息,也可以上传档案

  • 提供范例: in-context learning (注意,是没有训练,没有改变参数的)

  • 鼓励 chatgpt 想一想 (例如使用下面的魔法咒语表 🔮 Chain of Thought (CoT))

  • 使用外挂 (例如 +搜索引擎, 具体怎么学习呢 -> 参考:https://youtu.be/ZlD220t Mpl?feature=shared)

  • 拆解任务后执行 (可以让 chatgpt 自己拆解)

  • 让它反思 (例如:告诉它请检查上述答案是否正确)

🌊 ChatGPT 跟真实环境互动 (例如可以操控机器臂)


参考资料:面向每个人的生成式AI, 【李宏毅 LLM 大模型】

相关推荐
happyprince1 天前
2026年02月08日热门论文
人工智能·深度学习·计算机视觉
七牛云行业应用1 天前
1M上下文腐烂?实测Opus 4.6 vs GPT-5.3及MoA降本架构源码
人工智能·python·llm·架构设计·gpt-5·claude-opus
芷栀夏1 天前
CANN ops-math:面向 AI 计算的基础数学算子开发与高性能调用实战指南
人工智能·深度学习·神经网络·cann
普马萨特1 天前
Agent × Google Maps × Gemini:地理智能时代的新发现
人工智能
愚公搬代码1 天前
【愚公系列】《AI短视频创作一本通》018-AI语音及音乐的创作(短视频背景音乐的选择及创作)
人工智能·音视频
那个村的李富贵1 天前
光影魔术师:CANN加速实时图像风格迁移,让每张照片秒变大师画作
人工智能·aigc·cann
腾讯云开发者1 天前
“痛点”到“通点”!一份让 AI 真正落地产生真金白银的实战指南
人工智能
CareyWYR1 天前
每周AI论文速递(260202-260206)
人工智能
hopsky1 天前
大模型生成PPT的技术原理
人工智能
禁默1 天前
打通 AI 与信号处理的“任督二脉”:Ascend SIP Boost 加速库深度实战
人工智能·信号处理·cann