ChatGPT Canvas:交互式对话编辑器

自两年前 ChatGPT 发布以来,主流 AI 均以对话形式进行交互。传统的对话式界面可以直观看到反馈结果,但在需要深度编辑和协作的项目中就略显局限。为了解决此问题,几个月前 Claude 就发布过 Artifacts 功能,用来拓展原有对话。而现在 ChatGPT 也推出了 Canvas(Introducing canvas)来应对更加复杂的交互需求。

目前,OpenAI 已经向 ChatGPT Plus 和 Team 用户推送 Canvas,企业和教育用户将在下周获得访问权限。当 Canvas 测试版结束后,会向所有 ChatGPT 免费用户开放此功能。

什么是 Canvas?

Canvas 是基于 GPT-4o 特别训练的一个模型(专门为写作和编程任务设计的协作工具),能够在需要时自动触发 Canvas 界面,并根据用户的需求进行精准的内容编辑和修改。为了让 GPT-4o 更好地与用户协作,OpenAI 的研究团队通过一系列自动化评估和合成数据生成技术,优化了模型的核心行为。这些行为包括生成多样化的内容、进行定向编辑、重写文档以及提供行内反馈。

补充细节

OpenAI 通过 20 多次自动化评估来衡量模型的改进,使用了创新的合成数据生成技术(例如从 OpenAI o1-preview 中提取输出),以加速解决写作质量和用户交互问题,而不依赖人工数据。

在训练中遇到的关键挑战之一是如何定义 Canvas 的触发条件。OpenAI 教会模型在处理复杂任务时触发 Canvas,例如"撰写关于咖啡豆历史的博客文章",并避免在简单问答中过度触发,例如"帮我做晚餐新菜谱"。模型优先提高"正确触发"的准确性,即便牺牲了"正确不触发"的表现,最终达到了 83% 的准确率,相比于基准零样本 GPT-4o 显著提升。

另一个挑战是,在 Canvas 触发后如何调控模型的编辑行为,尤其是在定向编辑和重写之间做出选择。OpenAI 训练模型在用户明确选择文本时执行定向编辑,其他情况下倾向于进行重写。随着模型的优化,这一行为会持续改进。

对于写作和编程任务,优先提高 Canvas 定向编辑的表现。带有 Canvas 的 GPT-4o 比基准提示 GPT-4o 的表现提高了 18%。

最后,生成高质量注释也面临着困难。不同于前两个功能,这无法通过自动化轻松评估,因此使用人工评估来衡量注释的质量和准确性。结果发现,Canvas 模型在准确性方面相比于基准零样本 GPT-4o 提高了 30%,质量提升了 16%,说明合成训练比单纯的零样本提示更能显著提升模型的表现。

Canvas模型比带有提示指令的zero-shot GPT-4o准确率高30%,质量高16%。

Canvas 核心功能

借助 Canvas,用户可以通过突出显示特定部分,让 ChatGPT 关注并提供行内反馈和建议,类似于专业的文稿编辑或代码审查员。同时,用户还能够直接在 Canvas 中编辑文本或代码,增强对项目的掌控力。Canvas 还配备了一个快捷操作菜单,用户可以通过菜单执行各种实用任务,如调整文稿长度、调试代码,甚至恢复之前的版本(实测只能恢复上一版,不能跳跃恢复),使工作流程更加高效灵活。

快捷写作

对于写作任务,Canvas 提供了更改阅读水平、检查语法和添加表情符号等选项,使创作过程更加高效和多样化。

  • 提出修改建议:ChatGPT 提供行内建议和反馈。

  • 调整内容长度:将文档长度编辑得更短或更长。

  • 更改阅读水平:调整阅读水平,从幼儿园到研究生院。

  • 添加最终润色:检查语法、清晰度和一致性。

  • 添加表情符号:添加相关的表情符号以强调和着色。

快捷编程

编程是一个反复迭代的过程,传统对话式 AI 在跟踪代码变更时往往会面临各种困难。Canvas 使跟踪和理解 ChatGPT 的更改更加容易,OpenAI 也将持续改进这种编辑的透明度。

  • 审查代码:ChatGPT 提供行内建议以改进代码。

  • 添加日志:插入打印语句以帮助调试和理解代码。

  • 添加注释:为代码添加注释,使其更易于理解。

  • 修复错误:检测并重写问题代码以解决错误。

  • 转换语言:将代码翻译为 JavaScript、TypeScript、Python、Java、C++ 或 PHP。

例如我们先给ChatGPT提出一个要求:

帮我用Rust写一个API Webserver。

在Canvas中,我们针对某个代码片段,可以通过类似划词的方式,让它按要求对代码进行更改:

对特别细节的内容,我们也可以手动进行更改:

大家觉得OpenAI新出的Canvas功能如何呢?欢迎体验过后在评论区留言讨论。

相关推荐
大写-凌祁1 天前
零基础入门深度学习:从理论到实战,GitHub+开源资源全指南(2025最新版)
人工智能·深度学习·开源·github
焦耳加热1 天前
阿德莱德大学Nat. Commun.:盐模板策略实现废弃塑料到单原子催化剂的高值转化,推动环境与能源催化应用
人工智能·算法·机器学习·能源·材料工程
深空数字孪生1 天前
储能调峰新实践:智慧能源平台如何保障风电消纳与电网稳定?
大数据·人工智能·物联网
wan5555cn1 天前
多张图片生成视频模型技术深度解析
人工智能·笔记·深度学习·算法·音视频
格林威1 天前
机器视觉检测的光源基础知识及光源选型
人工智能·深度学习·数码相机·yolo·计算机视觉·视觉检测
2501_915918411 天前
Web 前端可视化开发工具对比 低代码平台、可视化搭建工具、前端可视化编辑器与在线可视化开发环境的实战分析
前端·低代码·ios·小程序·uni-app·编辑器·iphone
今天也要学习吖1 天前
谷歌nano banana官方Prompt模板发布,解锁六大图像生成风格
人工智能·学习·ai·prompt·nano banana·谷歌ai
Hello123网站1 天前
glean-企业级AI搜索和知识发现平台
人工智能·产品运营·ai工具
AKAMAI1 天前
Queue-it 为数十亿用户增强在线体验
人工智能·云原生·云计算
索迪迈科技1 天前
INDEMIND亮相2025科技创变者大会,以机器人空间智能技术解锁具身智能新边界
人工智能·机器人·扫地机器人·空间智能·陪伴机器人