生成式AI的三种协作模式

©作者| cami

来源| 神州问学

摘要

本文研究了生成式AI与人类的交互，并将其分为了三个协作模式：嵌入模式、副驾驶模式和智能体模式。嵌入模式中，人类通过拆解目标引导AI完成任务，突显了人类在决策中的主导作用；副驾驶模式中，人类与AI共同促成了目标的达成；而智能体模式则展现了生成式AI更强的独立性，因为其能够自主理解、拆解、规划和执行任务。这三种模式中，决策权逐渐由人类转向AI。这一演变揭示了生成式AI与人类协作的不同层次，呈现出由人类主导到与AI共同决策，再到AI自主执行的趋势。

当今科技的浪潮席卷而来，生成式人工智能（AI）正成为这场数字革命的中坚力量。在这个迅速演进的领域中，我们见证了一个接一个的创新，而其中的嵌入（embedding）、副驾驶（Copilot）、智能体（Agents）模式正在重新定义着人机交互的方式。它们的出现标志着AI在处理信息、解决问题以及参与创造性任务方面的进化。本文将研究这三种模式的定义、演进以及应用场景，从而揭示它们是如何推动着技术的不断进步。

（配图：三种协作模式的区分总结）

嵌入模式

在生成式AI的智能革命中，嵌入模式率先出现在人们生活中。在这一模式下，用户可以在拆解目标后，通过提供一系列提示词或者关键词来明确具体的支线任务，这也成为了AI理解用户意图的关键因素。这种互动机制使得AI能够更准确地捕捉用户需求，并在后续互动中逐步完善细节。整个过程中，模型的生成能力得以充分展现。

以创造性任务为例，当我们要写一篇小说，我们首先需要确定题材，故事方向以及故事框架。这些都是创作过程的基础，基于此才能够继续补充细节。在嵌入模式中，人类作为决策者需要将整体目标拆分为一系列可以逐步完成的任务。在后续与AI的互动中，我们可以逐步输入各个分解出的任务，指导AI按照我们设定的步骤完成创作的不同阶段。例如，我们可以通过提示词来让AI创造主要人物、设定故事大纲，然后逐渐引导AI填充故事细节。在这一过程中，人类作为主导者，通过拆解目标、提供清晰指导，有效地引导AI完成各个任务，最终形成一篇符合我们要求的完整的小说。

总的来说，在嵌入模式下，人类首先设定了目标，然后拆分成具体步骤并且以自然语言与AI交互，逐步引导AI生成我们想要的结果。因此，这一模式的特点主要在于人类主导决策 ，而AI则充当执行人类命令的工具。

嵌入模式在各个领域都展现了卓越的应用价值，尤其在文学创作、影视编剧、广告创意等领域表现突出。通过与AI的创意合作，用户得以更灵活地打造符合用户个性的创意作品，减少灵感卡顿的情况出现。同时，这一模式的出现也为创作者提供了全新的创作方式。

副驾驶（Copilot）模式

Copilot概念是由微软在2021年引入的，它的主要功能是为开发者在编写代码的过程中提供实时的代码建议。这些建议不仅包括简单的代码补全，还能生成整段的代码，从而极大地提升了开发效率。当AI识别到代码需要补全时，它会分析已有的代码结构，然后列出后续可补全的代码供开发者选择。随后的工作阶段中，人类与AI之间的不断交互变得至关重要。在此之后，AI持续提供建议，而人类则负责根据项目需求来进行选择和调整。这种模式下，AI将全程参与整个工作流程，从提供初始建议、给出框架，一直到协助完成流程的各个阶段。在这种合作伙伴关系中，AI不仅仅是一个工具，更是一个知识丰富的助手。

以副驾驶模式在PPT上的使用为例，当我们进行PPT创建时，有时可能会对当前PPT的顺序是否符合逻辑感到不确定。在这种情况下，我们可以借助AI的协助来整理这个PPT的架构。此时，我们只需要在与AI的对话框中输入我们的目的，之后AI就会给我们提供建议让我们来选择。我们可以根据这些建议来选择适合的方式，并且在后续的步骤中通过不断的互动来调整PPT结构使其最终符合我们的期望。

相较于嵌入模式，副驾驶模式 中AI的决策权 明显增大。在此模式下，人类与AI的关系更像是合作伙伴。AI不仅在后续流程中与人类互动生成最终结果，而且在拆分目标时，也能协助人类理清目标构成。 尤其是那些对于目标领域不熟悉的人，AI能够帮助他们梳理思路，从而更有效地达成目标。因此，在副驾驶模式下，AI通过对目标任务的分析，构建了解决方案，从而增强了决策的效率，并且在后续的进程中也提供了有力的支持与指导，来确保任务的高质量完成。

如今，副驾驶模式不仅被应用在了软件开发上，它也用在了很多日常的办公环境中。举例来说，它能够协助用户快速回复邮件或提炼邮件信息，极大地提高了邮件处理的效率。除此之外，对已有的表格数据，副驾驶模式的应用也展现了数据分析的能力，能够提供关于趋势、模式和异常值的建议，使用户能够更快速地进行数据探索和制定有效的分析策略。正如上文所说，副驾驶模式的应用还体现在幻灯片制作领域。通过引入这一模式，用户在创建PPT时，不仅可以根据输入的主题或内容获得幻灯片排列的智能建议，还能够根据主题生成相关的图表、图形和文字。因而，副驾驶模式的全面应用为办公工作带来了更为智能、高效的体验。

智能体（Agents）模式

在生成式AI的智能革命中，智能体（Agents）模式是一种更为独立和自主的模式。这种模式可以被理解为能够自主理解人类提出的问题，并基于这种理解来进行问题规划，进而自主决定需要执行哪些复杂任务的智能体。换句话说，当人类设定了目标后，它不仅能够提供关于"任务执行框架"的建议，而且可以自主开始任务执行，无需人类手动分配任务。 在这一过程中，人类主要是进行监督和评估最终结果，而不需要在每个步骤中都参与进去。

在智能体模式中，其核心流程可以被总结为三个能力的循环：感知（Perception）、规划（Planning）和行动（Action）。首先，通过感知能力，智能体能够从环境中收集信息 并从中提取有用的信息。紧接着就是规划阶段，它是智能体为实现特定目标而制定决策 的过程。最后，行动阶段则是基于感知到的信息和规划采取具体的动作。在感知、规划和行动的循环中，智能体能够在不断地与环境的互动中来学习和优化自身的行为。

区别于嵌入模式和副驾驶模式，智能体模式具有更强的决策权、独立性和自主性 。它强调AI能够自主感知环境，通过感知获取信息，进行规划、拆分任务并自主执行任务。 这与嵌入模式中用户主导、AI执行命令，以及副驾驶模式中用户与AI合作完成任务的方式形成鲜明对比。在智能体模式中，AI更像是一个自主学习的主体，具备了更强的独立思考和适应能力。在这一模式下，用户只是作为监督者和评估者的角色，引导任务目标并提供指导。

以游戏中的NPC为例，智能体模式可以使游戏中的虚拟角色更加逼真，更能给用户带来身临其境的体验感。NPC通过感知游戏环境，和与玩家的对话来识别玩家的行为和目标，然后基于此来规划制定相应的行动策略或者对话内容，最终实现与玩家的互动。在智能体模式下，NPC能够更自主地应对不同的情境和不同属性的玩家，使得游戏体验更具挑战性和趣味性。

智能体模式在自动驾驶、机器人控制、游戏设计等领域有着广泛的应用。在自动驾驶中，车辆可以通过感知道路、规划路径并执行行驶，实现智能驾驶的目的。在机器人控制中，智能体模式赋予机器人更强的自主决策能力，使其能够适应不同的任务环境，例如厨房做饭等。在游戏设计中，智能体模式可以提高NPC的智能水平，增加游戏的趣味性。这一模式为更多复杂任务的自主执行提供了可行性，并在各个领域展现出巨大的潜力。

结语

在本文中，我们探讨了生成式AI的三种模式：嵌入模式、副驾驶模式和智能体模式。嵌入模式需要用户通过对目标的深入理解来拆解目标并设定框架，然后将拆解后的任务给AI，让其协助完成任务。它更强调了人类在决策和指导中的主导地位。对于副驾驶模式而言，用户与AI作为合作伙伴，共同参与工作流程，决策权逐渐开始向AI倾斜。而智能体模式展现了更高的独立性和自主性，其能够自主理解问题、拆解问题、规划决策并执行任务，人类更偏向监督和最终的评估。在这三种协作模式的演化中，从人类主导的嵌入到AI与人类合作的副驾驶，再到AI自主执行的智能体，AI参与决策的权重逐渐增加，呈现出了渐进式的发展。

比尔盖茨预测：随着AI技术的广泛应用，未来五年内我们不再需要使用各种不同的应用程序来完成不同的任务。 相反，只需用日常用语告诉手机或电脑想要完成什么任务，它们就能够处理我们的请求。在不远的将来，每个上网的人都将能够拥有一个由人工智能驱动的个人助理，也就是"AI Agent"。智能体或将彻底改变用户使用计算机的方式，期间可能还有很长的路要走。但，智能体的时代或许正在来到。

图片及论文参考资料：

www.leadbank.com.cn/newsinfo/66...

zhuanlan.zhihu.com/p/659386520

support.microsoft.com/zh-cn/copil...