ChatGPT基础内容及使用
ChatGPT是由OpenAI开发的一个人工智能聊天机器人程序,于2022年11月推出。该程序使用基于GPT-3.5架构的大型语言模型并通过强化学习进行训练。
ChatGPT目前仍以文字方式互动,而除了可以透过人类自然对话方式进行交互,还可以用于相对复杂的语言工作,包括自动文本生成、自动问答、自动摘要等在内的多种任务。如:在自动文本生成方面,ChatGPT可以根据输入的文本自动生成类似的文本,在自动问答方面,ChatGPT可以根据输入的问题自动生成答案。还具有编写和调试计算机程序的能力。在推广期间,所有人可以免费注册,并在登入后后免费使用 ChatGPT 实现与 AI 机器人对话。
ChatGPT因其在许多知识领域给出详细的回答和清晰的答案而迅速获得关注,但其事实准确性参差不齐被认为是一重大缺陷。ChatGPT于2022年11月发布后,OpenAI估值已涨至290亿美元。上线两个月后,用户数量达到1亿。
概念
训练
ChatGPT 使用监督学习和强化学习在 GPT-3.5 之上进行了微调。
ChatGPT使用基于人类反馈的强化学习进行训练,这种方法通过人类干预以增强机器学习的效果,从而获得更为逼真的结果。其使用基于GPT-3.5架构的语言模型。 在训练过程中,人类训练师扮演着用户与人工智能助手的角色。模型在Microsoft Azure的超级计算机上训练,并通过近端策略优化算法(proximal policy optimization)进行微调。这种策略优化算法比信任域策略优化(trust region policy optimization)算法更为高效。
特点和局限
虽然聊天机器人的核心功能是模仿人类对话者,但ChatGPT用途广泛。 例如,具有编写和调试计算机程序的能力;创作音乐、电视剧、童话故事和学生论文; 回答测试问题(在某些测试情境下,水平高于普通人类测试者);写诗和歌词;模拟Linux系统等。
与其前身InstructGPT相比,ChatGPT试图减少有害和误导性的回复。例如,当InstructGPT接受"告诉我2015年克里斯托弗·哥伦布何时来到美国"的提问时,它会认为这是对真实事件的描述,而ChatGPT针对同一问题则会使用其对哥伦布航行的知识和对现代世界的理解来构建一个答案,假设如果哥伦布在2015年来到美国时可能会发生什么。ChatGPT的训练数据包括各种文档以及关于互联网、编程语言等各类知识。
与其他多数聊天机器人不同的是,ChatGPT能够记住与用户之前的对话内容和给它的提示。此外,为了防止ChatGPT接受或生成冒犯性言论,输入内容会由审核API进行过滤,以减少潜在的种族主义或性别歧视等内容。目前,有部分地区无法使用此项服务。
ChatGPT也存在一些局限。其奖励模型围绕人类监督而设计,可能导致过度优化,从而影响性能,即古德哈特定律。例如在训练过程中,不管实际理解或事实内容如何,审核者都会偏好更长的答案。训练数据有时也存在算法偏见,比如当程序接受到首席执行官之类的模糊描述时可能会假设此人是白人男性。
服务
OpenAI的总部位于圣弗朗西斯科的先驱大楼
ChatGPT于2022年11月30日由OpenAI位于旧金山的总部推出。该服务最初是免费向公众推出的,并计划以后通过该服务获利。到12月4日,OpenAI估计ChatGPT已有超过一百万用户。2023年1月,ChatGPT的用户数超过1亿,成为该时间段内增长最快的消费者应用程序。2022年12月15日,CNBC写道,该服务"仍然不时地发生故障"[19]。
《纽约时报》在2022年12月转述称,GPT的下一版本GPT-4据传言将于2023年某个时候推出。OpenAI计划推出ChatGPT专业版计划,每月收费42美元,需求较低时可使用免费计划。
评价
正面
《纽约时报》称其为"有史以来向公众发布的最好的人工智能聊天机器人。据报道,Microsoft Bing计划在其搜索引擎中添加ChatGPT功能选项,时间可能在2023年3月左右。根据CNBC的报道,谷歌员工正在紧锣密鼓地测试一个名为"学徒巴德"(英语:Apprentice Bard)的聊天机器人,谷歌准备拿来这位"学徒"和ChatGPT竞争。
负面反应
在发布后的几个月里,ChatGPT遭到了来自教育工作者、记者、艺术家、学者和公众倡导者的广泛而严厉的批评。The Verge网站的詹姆斯·文森特将ChatGPT的病毒式成功视为人工智能已成为主流的证据。CBC记者评论称ChatGPT有"幻觉"倾向。在线技术博客Mashable的迈克·珀尔用多个问题测试了ChatGPT,其中一次他问ChatGPT"中美洲除墨西哥外最大的国家"是哪个,ChatGPT回答称是危地马拉,而答案是尼加拉瓜。在CNBC向ChatGPT询问《The Ballad of Dwight Fry》的歌词时,ChatGPT给出了完全虚构的歌词。The Verge引用的研究人员将ChatGPT比作"随机鹦鹉",澳大利亚机器学习研究所的安东·范登亨格尔教授也给出了类似的观点,称之为"只是简单地重复它认为我们想听的话"的鹦鹉。
2022年12月,问答网站Stack Overflow禁止用户发布使用ChatGPT生成的答案,理由是ChatGPT的答案虽看似可用,实际上却有很高的错误率。2023年1月,国际机器学习大会禁止在提交的论文中使用ChatGPT或其他大型语言模型来生成任何文本。纽约市公立学校禁止师生在校园网路及装置上使用ChatGPT。
在2022年12月的一篇评论文章中,经济学家保罗·克鲁曼写道,ChatGPT将影响对知识工作者的需求。
影响
学术界
《大西洋》杂志的Stephen Marche指出它对学术界,尤其是入学申请论文的影响还有待了解。加州高中教师兼作家丹尼尔·赫尔曼(Daniel Herman)写道,ChatGPT 将迎来"高中英语的终结"。普林斯顿大学 的高年级本科生 Edward Tian 创建了一个名为"GPTZero"的程序,一个基于 GitHub Co-Pilot 构建的应用程序,它可以扫描文本以确定是否是另一个 AI 编写的,打击滥用。
自2023年1月4日起,纽约市教育局已限制从其公立学校互联网和设备访问ChatGPT。
自2023年1月24日起,出版商施普林格·自然规定在其旗下所有期刊的论文中,诸如ChatGPT之类的大语言模型不能被列入作者。同月26日,学术期刊《科学》禁止在论文中使用ChatGPT生成的文本,也禁止将ChatGPT署名作者。
其他
2023年2月7日,谷歌执行长皮查伊宣布将推出类似于ChatGPT的对话人工智能服务Bard;百度当天也确认类ChatGPT聊天机器人项目名字确定为"文心一言",英文名ERNIE Bot。
2023年2月8日,微软在新版必应搜索引擎和Edge浏览器中集成了ChatGPT技术的语言模型Prometheus。
API
OpenAI 尚未发布 ChatGPT 的官方 API,但有几个社区创建的库可用。
使用
官网访问:ChatGPT-OpenAI
准备
因为目前ChatGPT暂不支持中国大陆地区访问,因此我们需要准备VPN工具进行科学上网才能成功访问官网,博主使用的是SS。
其次,openai网站要求使用有效的国外电话号码进行验证,所以也需要准备一份有效的手机号用于接收短信验证码,博主使用的是sms-activate
目前发现国内QQ邮箱,地区在中国的gmail邮箱等均无法正常接收邮件验证
sms-activate
- 通过自己的邮箱注册 sms-activate.org 账号并完成邮箱验证
- 打开邮箱查收验证邮件并点击确认完成 sms-activate.org 账号认证
- 登录sms-activate并且在右上角找到充值按钮,点击进行充值
- 点击充值跳转后,往下滑找到支付宝,这里建议大家充值0.2美金就可以了(不够用再充)
- 充值好了以后回到首页搜索「open」关键字就可以找到 OpenAI 验证码的临时号码购买链接。
- 在右侧激活区看到待使用的临时号码,将此号码复制到 OpenAI 的验证码接收区里面。
- 在 OpenAI 的页面点击发送验证码,这样就可以在接码平台接收到验证码(有时候有一点慢需要耐心等待一下),将验证码填进去,这样就完成 ChatGPT 手机号验证了。
ChatGPT
- 登录 ChatGPT 账号并开始使用
- 注册完后,我们去 ChatGPT 网站去登陆:https://chat.openai.com/auth/login
- 输入我们上面第一步注册好的账号密码就可以成功登录
- 请务必注意使用 chat.openai.com 进行注册,使用openai进行注册的账号和chat.openai的账号无法通用
使用感受
具体内容、清晰逻辑识别
简单的、明确的提问
比喻、拟人、夸张等修辞手法和人类真实意图
缺乏理解。
传统文化理解存在错误(可能会通过已识别内容进行"再创作")
成语、俚语、歇后语识别
ChatGPT对搜索引擎引用
实时搜索引擎接入
程序算法
基础算法