【AI协作】让所有用电脑的场景都能在ChatGPT里完成。Canvas :新一代可视化交互,让AI易用易得

Canvas :新一代可视化交互,让AI易用易得

要使 AI 更有用、更易获得,需要重新思考我们如何与 AI 交互。Canvas 是一种新方法,也是自两年前推出以来对 ChatGPT 视觉界面的首次重大更新。

Canvas 目前处于早期测试阶段,我们计划快速改进其功能。

当前AI局限:聊天界面易于使用并且适用于许多任务

当您想处理需要编辑和修订的项目时,它会受到限制。Canvas 为此类工作提供了一个新界面。

使用 canvas,ChatGPT 可以更好地了解您要完成的任务的上下文。您可以突出显示特定部分以准确表明您希望 ChatGPT 关注的内容。就像文案编辑器或代码审阅者一样,它可以在考虑整个项目的情况下提供内联反馈和建议。

您可以在 canvas 中控制项目。您可以直接编辑文本或代码。有一个快捷方式菜单供您要求 ChatGPT 调整写入长度、调试代码并快速执行其他有用的操作。您还可以使用 canvas 中的后退按钮来恢复作品的先前版本。

当 ChatGPT 检测到可能有帮助的场景时,Canvas 会自动打开。 您还可以在提示中包含"use canvas"以打开 canvas 并使用它来处理现有项目。

编写快捷方式包括:

建议编辑:ChatGPT 提供内联建议和反馈。

调整长度:将文档长度编辑为更短或更长。

更改阅读级别:调整阅读级别,从 Kindergarten (幼儿园) 到 Graduate School(研究生院)。

添加最终润色:检查语法、清晰度和一致性。

添加表情符号:添加相关的表情符号以强调和着色。

编写和编码:对文件工程等编辑修订

编码是一个迭代过程,在聊天中跟踪对代码的所有修订可能很困难。Canvas 可以更轻松地跟踪和理解 ChatGPT 的更改,我们计划继续提高此类编辑的透明度。

编码快捷方式包括:

审查代码: ChatGPT 提供内联建议来改进您的代码。

添加日志:插入 print 语句以帮助您调试和理解代码。

添加注释:向代码添加注释以使其更易于理解。

修复错误:检测并重写有问题的代码以解决错误。

移植到某种语言:将您的代码转换为 JavaScript、TypeScript、Python、Java、C++ 或 PHP。

训练模型成为协作者

我们训练 GPT-4o 作为创意合作伙伴进行协作。该模型知道何时打开画布、进行有针对性的编辑和完全重写。它还了解更广泛的上下文,以提供准确的反馈和建议。

为了支持这一点,我们的研究团队开发了以下核心行为:

触发画布进行编写和编码

生成多样化的内容类型

进行有针对性的编辑

重写文档

提供内联评论

我们通过 20 多项自动化内部评估来衡量进展情况。我们使用了新颖的合成数据生成技术,例如从 OpenAI o1-preview 中提取输出,以针对其核心行为对模型进行后训练。这种方法使我们能够快速解决写作质量和新用户交互问题,而无需依赖人工生成的数据。

一个关键挑战是定义何时触发画布。我们教模型打开画布以提示 "Write a blog post about the history of coffee beans" ,同时避免过度触发一般的问答任务 "Help me cook a new recipe for dinner" 等。对于编写任务,我们优先改进"正确的触发器"(以牺牲"正确的非触发器"为代价),与带有提示说明的基线零镜头 GPT-83o 相比,达到了 4%。

值得注意的是,此类基线的质量对所使用的特定提示高度敏感。使用不同的提示,基线可能仍然表现不佳,但方式不同,例如,编码和编写任务之间均匀不准确,从而导致错误分布不同和性能欠佳的替代形式。对于编码,我们故意使模型不触发,以避免干扰我们的高级用户。我们将继续根据用户反馈进行改进。

效果对比:带prompt与带Canvas 的ChatGPT

人工评估评估了画布评论的质量和准确性功能。我们的画布模型在提示指令方面优于零镜头 GPT-4o,准确率提高了 30%,质量提高了 16%。

相关推荐
sniper_fandc9 分钟前
深度学习基础—Beam search集束搜索
人工智能·深度学习
阿万音玲羽10 分钟前
李沐《动手学深度学习》kaggle树叶分类(ResNet18无预训练)python代码实现
人工智能·python·深度学习·机器学习·分类·cnn
有Li1 小时前
稀疏视角CBCT重建的几何感知衰减学习|文献速递-基于深度学习的病灶分割与数据超分辨率
人工智能·深度学习·学习
知来者逆1 小时前
探索大规模语言模型(LLM)在心理健康护理领域中的应用与潜力
人工智能·gpt·深度学习·神经网络·自然语言处理·chatgpt·llm
weixin_443290691 小时前
【阅读记录-章节2】Build a Large Language Model (From Scratch)
人工智能·语言模型·自然语言处理
cts6181 小时前
NLP开发常见问题
人工智能·机器学习·自然语言处理
三月七(爱看动漫的程序员)1 小时前
LM2 : A Simple Society of Language Models Solves Complex Reasoning
人工智能·gpt·语言模型·自然语言处理·chatgpt·langchain·1024程序员节
学不会lostfound1 小时前
三、计算机视觉_01图像的基本操作
人工智能·opencv·计算机视觉·pil·卷积池化
知来者逆2 小时前
基于集成Whisper 与 Pepper-GPT改进人机交互体验并实现顺畅通信
人工智能·gpt·语言模型·自然语言处理·whisper·人机交互