【吴恩达】ChatGPT提示工程师 笔记【第一课 引言】

课程1视频地址

欢迎参加这个关于为开发者设计的ChatGPT提示工程课程。

我很高兴有Isa Fulford和我一起教授这个课程。她是OpenAI的技术团队成员,开发了广受欢迎的ChatGPT检索插件,她的很大一部分工作是教人们如何在产品中使用LLM或大型语言模型技术。她还为OpenAI Cookbook做出了贡献,该书教授人们如何使用提示。很高兴有你加入。

我也很高兴在这里和大家分享一些提示的最佳实践。

因此,互联网上有很多关于提示的材料,比如"每个人都必须知道的30个提示"。这些主要集中在ChatGPT的网络用户界面上,许多人使用它来执行特定的、通常是一次性的任务。但是,我认为作为开发者工具的LLMs,即使用API调用LLMs快速构建软件应用程序的能力,仍然被低估了。

事实上,我在AI Fund的团队,这是DeepLearning.ai的姐妹公司,一直在和许多初创公司合作,将这些技术应用于许多不同的应用中,看到LLM API能让开发者非常快速地构建什么,这很令人兴奋。因此,在本课程中,我们将与您分享一些您可以做的事情,以及如何做的最佳实践。

有很多材料需要涵盖。首先,你将学习一些用于软件开发的提示最佳实践,然后我们将介绍一些常见的用例,如总结、推断、转换、扩展,然后你将使用LLM构建一个聊天机器人。我们希望这能激发您构建新应用程序的想象力。

因此,在大型语言模型或LLM的发展中,大致有两种类型的LLM,我将称之为基础LLM和指令调优LLM。

所以,基础LLM经过训练,可以根据文本训练数据预测下一个词,通常在大量来自互联网和其他来源的数据上进行训练,以弄清楚下一个最可能的词是什么。例如,如果你提示我们从前有一只独角兽,它可能会完成这个,也就是预测接下来的几个词是住在一个神奇的森林里,和所有独角兽朋友在一起。

但如果你提示我们法国的首都是什么,那么根据互联网上的文章可能包含的内容,基础LLM很可能会完成这个,比如法国最大的城市是什么,法国的人口是多少等,因为互联网上的文章很可能是关于法国的问题列表。

相比之下,一个指令调优LLM,这是LLM研究和实践的很大动力所在,一个指令调优LLM经过训练,可以遵循指令。因此,如果你问它法国的首都是什么,它更有可能输出类似于法国的首都是巴黎的内容。所以,通常训练指令调优LLM的方法是,首先用大量文本数据训练一个基础LLM,然后进一步用指令和尝试遵循这些指令的输入和输出来训练它,然后通常进一步使用一种称为RLHF(来自人类反馈的强化学习)的技术进行精炼,使系统更能够提供帮助并遵循指示。

因为经过指令调优的LLM已经被训练得有益、诚实且无害,所以例如,它们不太可能输出像基础LLM那样可能出现问题的文本,如有毒的输出,许多实际使用场景已经转向了指令调优的LLM。你在互联网上找到的一些最佳实践可能更适合基础的LLM,但对于今天的大多数实际应用,我们会建议大多数人更关注指令调优的LLM,这些LLM更易于使用,而且由于OpenAI和其他LLM公司的工作,它们变得更安全,更符合要求。 因此,本课程将重点介绍指令调优LLM的最佳实践,这也是我们建议你在大多数应用中使用的。在继续之前,我只想感谢OpenAI和DeepLearning.ai的团队,他们为Isa和我将要演讲的材料做出了贡献。我非常感谢来自OpenAI的Andrew Mayne、Joe Palermo、Boris Power、Ted Sanders和Lillian Weng,他们与我们一起参与了素材的头脑风暴,审查素材,为这个短期课程制定了课程。我也感谢DeepLearning团队的Geoff Lodwig、Eddy Shyu和Tommy Nelson的工作。

因此,当你使用一个指令调优的LLM时,想象你是在给另一个人,比如一个聪明但不了解你的任务细节的人,给出指示。所以,当一个LLM不起作用时,有时是因为指示不够清楚。例如,如果你说,写一些关于艾伦·图灵的东西。除此之外,明确你希望文本重点放在他的科学工作、个人生活、历史角色或其他方面,也会有帮助。如果你能明确你希望文本的语气,是应该像职业记者写的那样,还是更像你给朋友草草写的一封便签?这对LLM生成你想要的东西有帮助。

当然,如果你想象自己让一个刚毕业的大学生为你执行这项任务,如果你甚至可以指定他们应该提前阅读什么样的文本片段,以便写这篇关于艾伦·图灵的文章,那么这会更好地为这个新鲜的大学毕业生成功执行这项任务。所以,在接下来的视频中,你会看到如何明确和具体,这是提示LLM的一个重要原则。你还会从Isa那里学到一个提示的第二个原则,那就是给LLM时间思考。所以,让我们继续下一个视频。

相关推荐
GetcharZp4 小时前
玩转 Linux 机器视觉:手把手带你搞定 Ubuntu 下海康工业相机 C++ SDK
后端
橙子家5 小时前
浏览器缓存之【基础键值存储】:Local storage 和 Session storage
前端
星星在线7 小时前
MusicFree:一个「All in One」的个人音乐服务器,让听歌回归简单
前端·后端
IT_陈寒8 小时前
Redis的SETNX并发问题让我加了三天班
前端·人工智能·后端
demo007x8 小时前
Docling 文档转换以及技术架构分析
前端·后端·程序员
京东云开发者9 小时前
京东市民服务又“上新”!这次是黑龙江“龙易办”
前端
袋鱼不重9 小时前
我的神奇同事,AI 用多了居然写了个 Open In Codex
前端·后端·ai编程
用户83562907805110 小时前
使用 Python 操作 Word 内容控件
后端·python
像我这样帅的人丶你还10 小时前
啥? 前端也要会干Java?🛵🛵🛵
后端
Hommy8810 小时前
【剪映小助手】添加贴纸接口(Add Sticker)
后端·github·剪映小助手·视频剪辑自动化·剪映api