我们推出了 canvas,这是一个与 ChatGPT 互助编写和编码项目的新界面,超越了大略的谈天。Canvas 在单独的窗口中打开,许可您和 ChatGPT 协作处理一个项目。这个早期测试版引入了一种新的互助办法 - 不仅通过对话,而且通过并排创造和完善想法。
Canvas 是利用 GPT-4o 构建的,可以在 beta 版中在模型选择器中手动选择。从本日开始,我们将向环球的 ChatGPT Plus 和 Team 用户推出 canvas。Enterprise 和 Edu 用户将不才周得到访问权限。我们还操持在 ChatGPT Free 测试版结束后向所有用户供应 Canvas。
与 ChatGPT 更好地协作人们每天都利用 ChatGPT 来帮助编写和编码。只管谈天界面易于利用并且适用于许多任务,但当您想处理须要编辑和修订的项目时,它会受到限定。Canvas 为此类事情供应了一个新界面。
利用 canvas,ChatGPT 可以更好地理解您要完成的任务的高下文。您可以突出显示特定部分以准确表明您希望 ChatGPT 关注的内容。就像文案编辑器或代码审阅者一样,它可以在考虑全体项目的情形下供应内联反馈和建议。
您可以在 canvas 中掌握项目。您可以直接编辑文本或代码。有一个快捷办法菜单供您哀求 ChatGPT 调度写入长度、调试代码并快速实行其他有用的操作。您还可以利用 canvas 中的退却撤退按钮来规复作品的先前版本。
当 ChatGPT 检测到可能有帮助的场景时,Canvas 会自动打开。 您还可以在提示中包含“use canvas”以打开 canvas 并利用它来处理现有项目。
编写快捷办法包括:
建议编辑:ChatGPT 供应内联建媾和反馈。调度长度:将文档长度编辑为更短或更长。变动阅读级别:调度阅读级别,从 Kindergarten (幼儿园) 到 Graduate School(研究生院)。添加终极润色:检讨语法、清晰度和同等性。添加表情符号:添加干系的表情符号以强调和着色。在 canvas 中编码编码是一个迭代过程,在谈天中跟踪对代码的所有修订可能很困难。Canvas 可以更轻松地跟踪和理解 ChatGPT 的变动,我们操持连续提高此类编辑的透明度。编码快捷办法包括:
审查代码: ChatGPT 供应内联建议来改进您的代码。添加日志:插入 print 语句以帮助您调试和理解代码。添加注释:向代码添加注释以使其更易于理解。修复缺点:检测并重写有问题的代码以办理缺点。移植到某种措辞:将您的代码转换为 JavaScript、TypeScript、Python、Java、C++ 或 PHP。演习模型成为协作者我们演习 GPT-4o 作为创意互助伙伴进行协作。该模型知道何时打开画布、进行有针对性的编辑和完备重写。它还理解更广泛的高下文,以供应准确的反馈和建议。
为了支持这一点,我们的研究团队开拓了以下核心行为:
触发画布进行编写和编码天生多样化的内容类型进行有针对性的编辑重写文档供应内联评论我们通过 20 多项自动化内部评估来衡量进展情形。我们利用了新颖的合成数据天生技能,例如从 OpenAI o1-preview 中提取输出,以针对其核心行为对模型进行后演习。这种方法使我们能够快速办理写作质量和新用户交互问题,而无需依赖人工天生的数据。
一个关键寻衅是定义何时触发画布。我们教模型打开画布以提示 “Write a blog post about the history of coffee beans” ,同时避免过度触发一样平常的问答任务 “Help me cook a new recipe for dinner” 等。对付编写任务,我们优先改进“精确的触发器”(以捐躯“精确的非触发器”为代价),与带有提示解释的基线零镜头 GPT-4o 比较,达到了 83%。
值得把稳的是,此类基线的质量对所利用的特定提示高度敏感。利用不同的提示,基线可能仍旧表现不佳,但办法不同,例如,编码和编写任务之间均匀不准确,从而导致缺点分布不同和性能欠佳的替代形式。对付编码,我们故意使模型不触发,以避免滋扰我们的高等用户。我们将连续根据用户反馈进行改进。
画布决策边界触发器 - 编写和编码提示 GPT-4o
带画布的 GPT-4o
正在写入(精确的触发器画布)写入 (更正 don't trigger canvas)编码(更正:不触发画布)编码(精确的触发画布)0.000.100.200.300.400.500.600.700.800.901.00
对付编写和编码任务,我们改进了精确触发画布决策边界的能力,与带有提示指令的基线零镜头 GPT-4o 比较,分别达到了 83% 和 94%。
第二个寻衅涉及在触发画布后调度模型的编辑行为,特殊是决定何时进行有针对性的编辑,而不是重写全体内容。我们演习模型在用户通过界面显式选择文本时实行有针对性的编辑,否则会方向于重写。随着我们优化模型,此行为会不断演化。
画布编辑边界 - 编写与编码提示 GPT-4o
带画布的 GPT-4o
Canvas 完备重写Canvas 定向编辑0.00.10.20.30.40.50.60.70.80.91.0
对付编写和编码任务,我们优先改进 canvas 定向编辑。带有画布的 GPT-4o 的性能比基线提示的 GPT-4o 好 18%。
末了,演习模型天生高质量的评论须要仔细迭代。与前两种情形不同,前两种情形很随意马虎适应通过彻底的人工审核进行自动评估,而以自动化办法衡量质量则特殊具有寻衅性。因此,我们利用人工评估来评估评论的质量和准确性。我们的集成画布模型在提示指令的准确率和 16% 的质量上比零射击 GPT-4o 赶过 30%,这表明与带有详细解释的零射击提示比较,合成演习显著提高了相应质量和行为。
Canvas 建议的评论提示 GPT-4o
带画布的 GPT-4o
注释触发精确性建议评论的质量0.00.10.20.30.40.50.60.70.80.91.0
人工评估评估了画布评论的质量和准确性功能。我们的画布模型在提示指令方面优于零镜头 GPT-4o,准确率提高了 30%,质量提高了 16%。
下一步要使 AI 更有用、更易得到,须要重新思考我们如何与 AI 交互。Canvas 是一种新方法,也是自两年前推出以来对 ChatGPT 视觉界面的首次重大更新。Canvas 目前处于早期测试阶段,我们操持快速改进其功能。