【极速版 -- 大模型入门到进阶】快速了解大型语言模型

CODE_RabbitV2025-03-24 15:00

文章目录

- [🌊 大模型作为一种生成式人工智慧，厉害在哪儿？-> 通用能力](#🌊 大模型作为一种生成式人工智慧，厉害在哪儿？-> 通用能力)
- [🌊 LLM 如何生成输出：简而言之就是文字接龙](#🌊 LLM 如何生成输出：简而言之就是文字接龙)
- [🌊 GPT 之前 ...：模型规模和数据规模概览](#🌊 GPT 之前 ...：模型规模和数据规模概览)
- [🌊 ChatGPT 有三个训练阶段：预训练、督导式学习、强化学习](#🌊 ChatGPT 有三个训练阶段：预训练、督导式学习、强化学习)
- [🌊 ChatGPT 使用：人类向 chatgpt 靠近](#🌊 ChatGPT 使用：人类向 chatgpt 靠近)
- [🌊 ChatGPT 跟真实环境互动 (例如可以操控机器臂)](#🌊 ChatGPT 跟真实环境互动 (例如可以操控机器臂))

🌊 大模型作为一种生成式人工智慧，厉害在哪儿？-> 通用能力

🌊 LLM 如何生成输出：简而言之就是文字接龙

🌊 GPT 之前 ...：模型规模和数据规模概览

之前都是从网络上各类文字资料学习 ...
之后开启下一个阶段：【督导式学习】由人类告诉 GPT 我们想要的答案是什么，这一阶段并不需要大量资料 (上万的资料就可以)

🌊 ChatGPT 有三个训练阶段：预训练、督导式学习、强化学习

Reinforcement Learning from Human Feedback (RLHF)：原理复杂概念简单；模型要有一定能力(偶有佳作)，进入 RLHF才有意义

🌊 ChatGPT 使用：人类向 chatgpt 靠近

讲清需求
提供足够的信息，也可以上传档案
提供范例: in-context learning (注意，是没有训练，没有改变参数的)
鼓励 chatgpt 想一想 (例如使用下面的魔法咒语表 🔮 Chain of Thought (CoT))
使用外挂 (例如 +搜索引擎, 具体怎么学习呢 -> 参考：https://youtu.be/ZlD220t Mpl?feature=shared)
拆解任务后执行 (可以让 chatgpt 自己拆解)
让它反思 (例如：告诉它请检查上述答案是否正确)

🌊 ChatGPT 跟真实环境互动 (例如可以操控机器臂)

参考资料：面向每个人的生成式AI, 【李宏毅 LLM 大模型】

上一篇：Nginx如何处理请求

下一篇：基于AWS Endpoint Security(EPS)的全天候威胁检测与响应闭环管理

热门推荐

01UV安装并设置国内源 02KGG转MP3工具|非KGM文件|解密音频 03【2025.08.06最新版】Android Studio下载、安装及配置记录（自动下载sdk）04Qwen3-Coder 快速上手教程 | Qwen Code + Claude Code 05蜘蛛磁力搜索引擎大全，如何使用蜘蛛磁力查找磁力链接 062025最新国内服务器可用docker源仓库地址大全（2025年8月更新）07TRAE 规则（Rules）配置指南：个人习惯、团队规范与最佳实践 08NVIDIA显卡驱动、CUDA、cuDNN 和 TensorRT 版本匹配指南 09全球最强模型Grok4，国内已可免费使用！（附教程）10TRAE Rules 实践：为项目配置 6A 工作流