Canvas :新一代可视化交互,让AI易用易得
要使 AI 更有用、更易获得,需要重新思考我们如何与 AI 交互。Canvas 是一种新方法,也是自两年前推出以来对 ChatGPT 视觉界面的首次重大更新。
Canvas 目前处于早期测试阶段,我们计划快速改进其功能。
当前AI局限:聊天界面易于使用并且适用于许多任务
当您想处理需要编辑和修订的项目时,它会受到限制。Canvas 为此类工作提供了一个新界面。
使用 canvas,ChatGPT 可以更好地了解您要完成的任务的上下文。您可以突出显示特定部分以准确表明您希望 ChatGPT 关注的内容。就像文案编辑器或代码审阅者一样,它可以在考虑整个项目的情况下提供内联反馈和建议。
您可以在 canvas 中控制项目。您可以直接编辑文本或代码。有一个快捷方式菜单供您要求 ChatGPT 调整写入长度、调试代码并快速执行其他有用的操作。您还可以使用 canvas 中的后退按钮来恢复作品的先前版本。
当 ChatGPT 检测到可能有帮助的场景时,Canvas 会自动打开。 您还可以在提示中包含"use canvas"以打开 canvas 并使用它来处理现有项目。
编写快捷方式包括:
建议编辑:ChatGPT 提供内联建议和反馈。
调整长度:将文档长度编辑为更短或更长。
更改阅读级别:调整阅读级别,从 Kindergarten (幼儿园) 到 Graduate School(研究生院)。
添加最终润色:检查语法、清晰度和一致性。
添加表情符号:添加相关的表情符号以强调和着色。
编写和编码:对文件工程等编辑修订
编码是一个迭代过程,在聊天中跟踪对代码的所有修订可能很困难。Canvas 可以更轻松地跟踪和理解 ChatGPT 的更改,我们计划继续提高此类编辑的透明度。
编码快捷方式包括:
审查代码: ChatGPT 提供内联建议来改进您的代码。
添加日志:插入 print 语句以帮助您调试和理解代码。
添加注释:向代码添加注释以使其更易于理解。
修复错误:检测并重写有问题的代码以解决错误。
移植到某种语言:将您的代码转换为 JavaScript、TypeScript、Python、Java、C++ 或 PHP。
训练模型成为协作者
我们训练 GPT-4o 作为创意合作伙伴进行协作。该模型知道何时打开画布、进行有针对性的编辑和完全重写。它还了解更广泛的上下文,以提供准确的反馈和建议。
为了支持这一点,我们的研究团队开发了以下核心行为:
触发画布进行编写和编码
生成多样化的内容类型
进行有针对性的编辑
重写文档
提供内联评论
我们通过 20 多项自动化内部评估来衡量进展情况。我们使用了新颖的合成数据生成技术,例如从 OpenAI o1-preview 中提取输出,以针对其核心行为对模型进行后训练。这种方法使我们能够快速解决写作质量和新用户交互问题,而无需依赖人工生成的数据。
一个关键挑战是定义何时触发画布。我们教模型打开画布以提示 "Write a blog post about the history of coffee beans" ,同时避免过度触发一般的问答任务 "Help me cook a new recipe for dinner" 等。对于编写任务,我们优先改进"正确的触发器"(以牺牲"正确的非触发器"为代价),与带有提示说明的基线零镜头 GPT-83o 相比,达到了 4%。
值得注意的是,此类基线的质量对所使用的特定提示高度敏感。使用不同的提示,基线可能仍然表现不佳,但方式不同,例如,编码和编写任务之间均匀不准确,从而导致错误分布不同和性能欠佳的替代形式。对于编码,我们故意使模型不触发,以避免干扰我们的高级用户。我们将继续根据用户反馈进行改进。
效果对比:带prompt与带Canvas 的ChatGPT
人工评估评估了画布评论的质量和准确性功能。我们的画布模型在提示指令方面优于零镜头 GPT-4o,准确率提高了 30%,质量提高了 16%。