【AIGC】《A Quick 80-Minute Guide to Large Language Models》

李宏毅老师《80分鐘快速了解大型語言模型》(2024)课程的学习笔记

深度学习

Transformer (2017)

LLM(Transformer neural network architecture 是 LLM 的关键技术)

AIGC 爆发

把 no explanation necessary 去掉直接丢给 GPT-4


里面有陷阱题,GPT 也没能答对

帮忙出考题,偏简单了

结合动漫角色,评价考题

上面展示了目前 LLM 的能力

为该门课程专门打造的 GPT

通过对话的功能,定制自己的 GPT

上传课程相关文件


能够文字接龙,如何回答问题呢?



单词不容易穷举,token 不是完整的单词


Holtzman A, Buys J, Du L, et al. The curious case of neural text degeneration[J]. arXiv preprint arXiv:1904.09751, 2019.

语言模型用 最大似然训练(MLE) 可以得到很好的模型,但在生成文本时用最大概率解码(greedy / beam search)结果却会出现退化文本(neural text degeneration,重复生成)

不是每次选择几率最大,投骰子

有结合上下文的能力


GPT-1 用 1GB 文字资料来学习文字接龙



GPT-3 可以 coding

GPT3 已经很强大了,只是学习的资料不行

eg:看到问题,不给回答,而出了 4 个选项

自督导式学习(上课前预习,pretrain

督导式学习(人类老师指导)

小模型加上人类老师后,也可以超越超大模型的能力

人类老师需要多少,才可以开窍呢?

只要教某一个语言的某一个任务,自动学会其它语言的同样任务


督导式学习是画龙点睛

RL 进一步减少了对人类老师的负担

RLHF,reinforcement learning from human feedback


reward model 模仿人类老师的偏好, chatGPT 跟着 reward model 学可以减少人类老师的依赖

督导式 + 增强式 = alignment,发布 GPT 3.5




eg:改语法错误

扩写报告

ps:要用 GPT 来润色你的论文,花钱用 4,不要用 3.5。没用 GPT 改过直接给老师,是失礼的行为,哈哈哈







chain of thought

eg:鸡兔同笼问题

提示词

通过大模型生成提示词


eg:提炼论文中的要点,生成 PPT


呼叫其它的外挂强化 GPT 的能力




LLM + RAG = 天下无敌?一定给正确答案?

不是的,终究是文字接龙,结合网络引擎搜索的结果再文字接龙而已,错误率会降低

台大其实是没有玫瑰花节的

用 LLM 写长篇小说

人类都不知道如何拆分为小任务时,也可以让 LLM 自己拆分任务,自己执行

制作学习 map

可能计划列的很好,但执行不了,卡住了,eg:要观看视频,它看不了。

需要持续发展进步





GPT3.5 虽然道歉了,但是输出的资讯还是之前一样的错误资讯

GPT4.0 反省能力更强

别把直觉性的回答直接输出,过滤法律、道德等层面的错误,修正后再回答

进一步,让两个模型挑战对方的结果

如何让 LLM 和真实环境互动

对机械臂来说,看不懂,进一步转化为可执行的动作


参考

相关推荐
魔术师Grace3 小时前
从传统企业架构到 OPC 模式,AI 到底改变了什么?
人工智能·程序员
沪漂阿龙3 小时前
LangGraph 持久化完全指南:从零搭建永不丢失状态的 AI Agent 系统
人工智能·流程图
杨浦老苏3 小时前
大模型安全接入网关LinkAI
人工智能·docker·ai·群晖·隐私保护
档案宝档案管理3 小时前
权限分级管控,全程可追溯,筑牢会计档案安全防线
运维·网络·人工智能
Chat_zhanggong3453 小时前
主推RK3567J作用有哪些?
人工智能·嵌入式硬件
墨风如雪3 小时前
算个账也要开顶配 AI?我让 AI 自己劝我换了个小的
aigc
qq_411262423 小时前
四博 AI 机械臂台灯智能音箱方案:让台灯具备视觉、语音、动作和学习陪伴能力
人工智能·语音识别
AI+程序员在路上4 小时前
VS Code 完全使用指南:下载、安装、核心功能与 内置AI 编程助手实战
开发语言·人工智能·windows·开源
coderyi4 小时前
Agent协作简析
人工智能
霍小毛4 小时前
破局工业数据孤岛!数字孪生+AI智慧设备资产管理平台,重构智能运维新范式
人工智能·重构