如何判断 AI 将优先自动化哪些任务?

思考 AI 将优先自动化哪些任务,有一个独特的视角,那就是 "描述-执行鸿沟":描述一个任务的难度,与亲手完成该任务的难度相比,差距究竟有多大?

那些"描述-执行鸿沟"巨大的任务,将是自动化的沃土。因为给这类任务创造训练数据相对容易,而且即便执行过程本身并不简单,自动化它们所带来的价值也极为可观。例如:

  • 修正长文中的语法错误:描述"请修正语法"非常简单,但手动检查并修改一篇长文则相当耗时。

  • 提交发票进行报销:描述"把这些发票报销了"很简单,但手动填写表格、上传、提交等一系列流程很繁琐。

  • 训练一个在标准评估基准上达到特定性能的模型:描述"训练一个模型,在某个数据集上达到 95% 的准确率"这个目标很明确,但实现它的过程涉及大量工作。

  • 构建一个应用程序:检查一个 App 的用户界面(UI)是否符合设计稿很容易,但要实现其背后复杂的后端功能则需要大量代码和调试。

反之,当任务的背景信息极其复杂(high-context),而技术挑战性又不高时,"描述-执行鸿沟"往往很小。自动化这类任务的价值本身就有限,而且为其创建训练数据也更加困难。例如:

  • 编写数据处理脚本:在很多情况下,直接用代码来处理数据,比用自然语言去描述处理规则更简洁、更精确。

  • 在高度定制化的代码库中进行消融研究:要在一个为特定模型、需要大量背景知识的代码库里进行实验,口头或书面描述你想要做的修改,可能比直接自己动手改代码更费劲。

  • 以特定风格剪辑视频:很多时候,与其费尽口舌描述每一个镜头的切换、调色、配乐的具体要求,还不如自己动手剪辑来得更快、更直接。

  • 帮我妈妈买中式杂货:她对要买的品牌、规格、数量都有非常具体的要求,而且还要懂得如何挑选最新鲜的蔬果。对她来说,亲自跑一趟比对我详细描述所有细节要容易得多。

这个概念与"判别器-生成器鸿沟"(discriminator-generator gap)有些相似,但又不完全一样。有些任务,比如上面提到的"以特定风格剪辑视频",可能评价一个视频剪辑得好不好很容易(判别器-生成器鸿沟大),但描述清楚如何剪辑却很难(描述-执行鸿沟小)。

相关推荐
Anastasiozzzz1 小时前
深入研究RAG: 在线阶段-查询&问答
数据库·人工智能·ai·embedding
tq10861 小时前
资本主义的时间贴现危机:AI时代的结构性淘汰机制
人工智能
砍材农夫1 小时前
spring-ai 第四多模态API
java·人工智能·spring
wd5i8kA8i4 小时前
自研多线程 SSH 极速文件传输助手(附 GitHub 源码)
运维·ssh·github
Boop_wu4 小时前
[Java 算法] 字符串
linux·运维·服务器·数据结构·算法·leetcode
土豆12504 小时前
LangGraph TypeScript 版入门与实践
人工智能·llm
土豆12504 小时前
OpenSpec:让 AI 编码助手从"乱猜"到"照单执行"
人工智能·llm
Thomas.Sir4 小时前
第二章:LlamaIndex 的基本概念
人工智能·python·ai·llama·llamaindex
m0_694845575 小时前
Dify部署教程:从AI原型到生产系统的一站式方案
服务器·人工智能·python·数据分析·开源
LS_learner5 小时前
VS Code 终端默认配置从 PowerShell 改为 CMD
人工智能