在2023年以前,公司会给员工配备电脑,2023年情况就反过来了,公司只是给电脑配备员工。
什么是AIGC
Chat GPT 、Midjourney 等AI工具的出现改变了我们的生活和工作方式。AI在生成文字、图片、音频、视频等领域方面发挥着关键作用,普通人已经很难辨别创作背后到底是人类还是AI。这类由AI生成的内容通常被称为 AIGC (AI Generated Content) ,中文简称**"AI生成内容"。在海的另一边,老外们喜欢用 Generative AI 这个词来描述生成式AI**。
典型的 AIGC 包括能生成文章的 Chat GPT ,能生成代码的 GitHub Copilot ,以及擅长绘画的 Midjourney 等。
热门的文本生成AI应用
本文主要介绍如何与 Chat GPT 更高效的对话,所以先随便放几个和 Chat GPT 同类的文本生成AI应用。
Chat GPT 里的 token 是什么?
人与人的交流最重要是把话说清楚,在与大型AI语言模型交互也是一样。
如果说者词不达意,听者就会一脸懵逼。
在与大型AI语言模型交互的过程中,提示起着关键的作用。所谓提示,即我们输入给AI的问题或指令。AI会根据这些提示生成相应的回应。一个良好的提示可以提高AI的理解和执行效率,为用户提供更准确和有用的回答。
在了解如何用好提示词之前,我们先关注一个参数:token
。
大部分的AI大模型是通过 token
计费的。token
可以被理解为文本的一个基本单位,这取决于不同平台计算token的规则。短单词可能每个词是一个 token
,长单词可能被拆成多个 token
。而中文所占的 token
数量会相对更多,有些字要用1个甚至多个 token
来表示。
根据 Open AI 官方的解释,一个 token
通常对应常见英文文本的约4个字符。每100个 token
约等于75个单词。但相比于估算 token
数,更精确的做法是使用『 Open AI 官方的 token
计算器 』来计算 token
数。
如果你输入中文,可能会看到一个中文就是一个 token
。而常用词可能一个词是一个 token
,比如"中国"这个词。而有些不常见的字可能会被映射成多个 token
,以至于网页无法展示拆分的半个字,所以就用乱码展示。
提示词技巧
提示工程**(Prompt Engineering)**就是一门研究怎么样让AI聊得更溜的领域,其核心关注点在于提升提示的设计和优化,目的就是让AI更懂得用户想要啥,然后能更准确地回应出来。
Open AI 官网的《用API进行提示工程的最佳实践》讲到如何给予 Chat GPT 清晰有效的指令。
原则1:使用最新的模型
Chat GPT 一直在发展,越新的模型通常会越聪明。
在写本文时最新的模型是 GPT-4。在上图中,排在越上面的模型就越新,在理解和生成方面的能力也越强。不过价格也会更贵。
- 现在普通用户要使用 GPT-4 的话,每个月需要付20美元。
- 开发者如果想将 GPT-4 接入自己项目里,可以Open AI 的价格表 里查看不同模型的价格。
原则2:把指令放在提示的开头,并且用###或"""来分隔指令和上下文
低效的❌
Plain
将下面的文本总结为重要的要点列表
{此处输入文字}
更好的✅
Plain
将下面的文本总结为重要的要点列表
文本:###
{此处输入文字}
###
原则3:尽可能具体、详细地描述所需的背景、结果、长度、格式、风格等
低效的❌
SQL
写一首关于Open AI的诗。
更好的✅
SQL
以{某著名诗人}的风格,写一首关于Open AI的鼓舞人心的短诗,主题要集中在最近的DALL-E产品上(DALL-E是一种根据文本生成图形的机器学习模型)。
原则4:通过示例(示例1、示例2)阐明所需的输出格式
如果不规定输出格式,GPT就会比较随心所欲的输出,这对之后做数据分析来说是不利的。
低效的❌
SQL
提取下面文本中提到的实体。提取以下4 种实体类型:公司名称、人名、特定主题和泛主题。
文本:{文本}
更好的✅
SQL
提取下面文本中提到的重要实体。首先提取所有公司名称,然后提取所有人名,然后提取适合内容的特定主题,最后提取一般总体主题
所需格式:
公司名称:<逗号分隔公司名称列表>
人名:-||-
特定主题:-||-
一般主题:-||-
文本:###
{此处输入文字}
###
原则5:先从零样本提示开始,效果不好,则用小样本提示
第一步:零样本
SQL
从下面的文本中提取关键字。
文本:###
{text}
###
第二步:小样本
SQL
从下面相应的文本中提取关键词。
文本 1:Stripe 提供 API,Web 开发人员可以使用这些 API 将支付处理集成到他们的网站和移动应用程序中。 关键词 1:Stripe、支付处理、API、Web 开发人员、网站、移动应用程序
###
文本 2:{text}
关键字 2:
###
原则6:减少模凌两可和不严谨的描述
低效的❌
SQL
给这个产品的简短描述一下,几句话就行,不要太多。
更好的✅
SQL
用3到5句话组成的一个段落来描述此产品。
原则7:与其告知不应该做什么,不如告知应该做什么
低效的❌
SQL
以下是客服与客户之间的对话。不要询问用户名或密码。不要重复。
客户:我无法登录我的帐户。
客服:
更好的✅
SQL
以下是客服与客户之间的对话。客服将尝试了解问题并提出解决方案,同时避免询问任何隐私相关的问题。不要询问用户名或密码等隐私,而是让用户参阅帮助文章www.samplewebsite.com/help/faq
客户:我无法登录我的帐户。
客服:
原则8:在使用代码生成功能时,可以使用"引导词"来引导模型生成特定模式的代码
具体来说,当我们需要生成特定类型的代码时,可以在提示中使用一些具有引导意义的词汇或短语,以引导模型按照我们想要的特定模式来生成代码。这些引导词可以是一些关键词、特定的语法结构或者代码片段,它们能够给模型提供一种暗示或者方向,使其更加倾向于生成符合我们需求的代码。
通过使用引导词,我们可以更加灵活地控制代码生成的输出,使其更加符合我们的期望和需求。同时,这也能够提高代码生成的效率和准确性,减少不必要的修改和调整。
比如,如果你希望生成一个循环结构的代码,你可以在输入中包含类似于"for"、"while"等词语,这样模型就会倾向于生成循环结构的代码。
低效的❌
SQL
生成代码来计算列表中的数字之和
更好的✅
SQL
生成一个for循环来计算列表中数字的总和。
提示词网站
该网站包含大量优秀的提示词模板,可以根据你的需求生成对应提示词并导入到 Chat GPT
里。可以指定 Chat GPT
使用什么语言回答。
自己去捣鼓一下吧~
点赞 + 关注 + 收藏 = 学会了