AI 与自动化：更多的自动化，全新的自动化方式？

每一次 ChatGPT 的更新，都会给我们带来大量新的能力，这些能力往往会逐步应用在改变我们现有工作流程上，因此我是比较看好这一波 AI 在自动化（RPA）领域的价值的，不过要将一个新技术真正应用直至取代复杂的工作流程，我觉得还需要不少的时间，但应该是接下来很大的一个机会。

前几天，a16z 前合伙人 Benedict Evans 写了一篇谈 AI 与自动化的文章，一些观点我比较认同。Benedict Evans 从历史每次技术变革的角度谈了他的一些看法：

会有更多的自动化即将到来，并且将是全新的自动化方式
新技术通常会使某些事情变得更便宜、更容易，这可能意味着你可以用更少的人做同样的事情，或者你可以用相同的人做更多的事情，这也意味着你往往会改变你所做的事情
人们用来完成工作的工具以及可能现在获得新的自动化的任务都非常复杂和专业，并且蕴含了大量的工作和机构知识，因此替换或自动化任何这些工具和任务都不是轻而易举的事情
虽然有人可能会认为 LLMs 将取代许多应用程序，但它也可能将在其他方面上带来全新的解构浪潮

下面对原文做了一下分享，内容比较长，翻译能力借助了 GPT-4，一些表达有问题的地方欢迎阅读原文：

https://www.ben-evans.com/benedictevans/2023/7/2/working-with-ai

ChatGPT 和生成式人工智能将改变我们的工作方式，但这与过去 200 年的所有自动化浪潮有何不同？这对就业、变革和煤炭消耗意味着什么？

几乎所有科技行业的人都认为，生成式人工智能、大型语言模型和 ChatGPT 是我们可以用软件实现的新一代变革，以及我们可以用软件实现自动化的新一代变革。关于 LLMs 的其他方面，并没有达成太多共识。实际上，我们仍在探讨争论的问题，但每个人都同意，还有更多的自动化即将到来，以及全新的自动化形式。

自动化意味着工作和人员，这也发生得非常快：ChatGPT 仅六个月就拥有了超过 1 亿的用户，Productiv 的数据表明它已经成为前十二个"影子 IT" App 之一。那么，这将带走多少工作岗位，速度有多快，是否可以有新的工作来取代它们？

我们应该记住，我们已经自动化工作的道路上有 200 年了。**每次我们经历自动化浪潮时，很多职业都会消失，但是新的职业类别会被创造出来。**在这个过程中会有摩擦性疼痛和错位，有时新的工作会分配给在不同地方不同的人，但随着时间的推移，总的工作数量不会减少，我们所有人都变得更加繁荣。

当这种情况发生在你自己的一代人身上时，担心这一次不会有新工作岗位是很自然的。我们可以看到那些消失的工作，但我们无法预测新工作将会是什么，而且通常它们还不存在。我们知道（或者应该知道），从经验上来说，过去总是会有新的工作岗位出现，而且它们也是不可预测的：1800 年没有人会预测到 1900 年会有 100 万美国人从事"铁路"工作，1900 年也没有人会预测到"视频后期制作"或"软件工程师"这些职业类别。

但仅仅因为过去总是会出现新的工作岗位，就凭信仰相信这一次也会出现似乎是不够的。你怎么知道这一次会发生呢？这次和以前不同吗？

在这个时候，任何一年级的经济学学生都会告诉我们，这个问题可以通过"劳动力总量谬误（Lump of Labour）"等原因来解释。

劳动力总量谬误是一种误解，认为要做的工作是固定的，如果一些工作被机器取代了，那么人们就会失去更少的工作。但如果使用机器制造一双鞋变得更便宜，那么鞋子就会更便宜，更多的人可以买鞋子，他们有更多的钱可以花在除此之外的其他东西上，并且我们会发现我们需要或想要新的东西，并创造新的工作岗位。

**效率收益不仅仅局限于鞋子：通常，它会通过经济体向外扩散，创造新的繁荣和新的工作岗位。**我们不知道新的工作会是什么，但我们有一个模型，它不仅表明总会有新的工作，而且说明这是过程本身固有的。因此，不要担心人工智能！

我认为，对这个模型最基本的挑战是说，过去 200 年的自动化实际上是在推动人类能力的提高。

我们从人类作为动物开始，然后逐步进化：我们自动化了腿部、手臂、手指，现在又开始自动化大脑。我们从农场劳作转向蓝领工作，再到白领工作，而现在连白领工作也将被自动化取代，剩下的将一无所有。工厂被呼叫中心所取代，但如果我们自动化了呼叫中心，还有什么其他选择？

在这里，我认为看一下经济和技术历史的另一个片段很有用：杰文斯悖论（ Jevons Paradox）。

19 世纪，英国海军靠煤炭运转。英国有很多煤炭（它是蒸汽时代的沙特阿拉伯），但人们担心煤炭用尽后会发生什么。啊，工程师说：别担心，因为蒸汽机变得更加高效，所以我们会用更少的煤炭。但是杰文斯说：如果我们让蒸汽机更加高效，那么它们将更便宜运行，我们会使用更多的蒸汽机，并将其用于新的和不同的事物，因此我们会使用更多的煤炭。创新可以与价格弹性相连。

我们已经将杰文斯悖论应用于白领工作 150 年了。

很难想象尚未存在的未来工作，但同样也很难想象已经被自动化取代的一些过去的工作。戈戈尔在 19 世纪 30 年代圣彼得堡的受压迫的职员们花费了他们整个成年生活一个接一个地手写复制文件。他们就像人类复印机一样。到了 19 世纪 80 年代，打字机以每分钟两倍速度产生完全清晰可读的文本，并提供六份免费副本。

打字机意味着职员可以产出超过 10 倍以上的输出量。几十年后，像巴勒斯这样的公司推出了计算器，为簿记和会计工作做到了同样效果：不再需要用笔加总列数，而是由机器替你完成，在 20% 的时间内无误差地完成任务。

那对文员就业产生了什么影响？人们雇用了更多的文员。自动化加上杰文斯悖论意味着更多的工作机会。

如果一个职员和一台机器可以完成 10 个人的工作，那么你可能会减少职员数量，但也可能会用他们做更多的事情。杰文斯告诉我们，如果某件事变得更便宜、更高效，你可能会做更多这样的事情------比如进行更多分析或管理更多库存。你可能会建立一个不同且更高效的业务，这只有在能够使用打字机和计算器自动化其管理时才有可能实现。

这个过程不断重复。这是 1960 年的杰克·莱蒙（Jack Lemmon）在《公寓》中扮演 CC 巴克斯特，使用了弗里登公司的电动机械计算器，而这种计算器已经问世 50 年了，并且曾经非常令人兴奋。

那个镜头中的每个人都是电子表格中的一个单元格，整座建筑就是一个电子表格。每周有人在顶楼按下 F9 键进行重新计算。但他们已经有了计算机，在 1965 年或 1970 年购买了一台大型机，并报废了所有的加法器。白领职业崩溃了吗？还是像 IBM 所宣传的那样，计算机给你多出 150 名工程师？25 年后，PC 革命和"会计部门装在盒子里"的解决方案对会计行业产生了什么影响呢？

丹·布里克林在 1979 年发明了电子表格软件，此前，"电子表格"指的是纸质文件（你现在仍然可以在亚马逊上购买）。他有一些关于早期使用的有趣故事：人们告诉我，"我做了这么多工作，同事们都觉得我很厉害。但实际上我只花了一个小时就完成了，然后休息了一整天。人们以为我是个天才，其实是因为用到了这个工具。"

那么，Excel 和个人电脑对会计就业产生了什么影响呢？它增加了就业机会。

40 年后，电子表格意味着你可以提前下班闲逛吗？事实上并不是这样的。

年轻人可能不会相信，但在电子表格出现之前，投资银行家工作时间真的很长。多亏了 Excel，高盛的助理们才能完成所有任务，并在周五下午 3 点离开办公室。现在有了 LLMs（低廉劳动力市场），他们每周只需要工作一天！

新技术通常会使某些事情变得更便宜、更容易，但这可能意味着你可以用更少的人做同样的事情，或者你可以用相同的人做更多的事情，这也意味着你往往会改变你所做的事情。

起初，我们让新工具适应旧的工作方式，但随着时间的推移，我们会改变我们的工作方式来适应工具。当 CC Baxter 的公司购买了一台大型计算机时，他们开始自动化他们已经做过的事情，但随着时间的推移，运营业务的新方式变得可能。

所以，所有这些都是为了说，默认情况下，我们应该期望语言模型（LLMs）像 SAP、Excel、大型计算机或打字机一样破坏、取代、创造、加速和增加就业。这只是更多的自动化。机器让一个人能够完成 10 倍的工作，但你仍然需要人来操作。

我认为目前有两种反驳观点。

第一个观点是说，也许这确实只是我们在互联网、个人电脑或计算机方面所见过的那种变革的延续，也许它对净就业没有长期影响，但这一次变化会更快速地发生，因此摩擦痛苦将更大，并且调整将更加困难。

LLMs 和 ChatGPT 无疑比 iPhone、互联网或者个人电脑等东西发展得更快。Apple II 于 1977 年上市，IBM PC 于 1981 年上市，Mac 于 1984 年上市，在 1990 年代初才有了 1 亿台 PC 在使用：而现在仅仅六个月就已经有 1 亿用户使用 ChatGPT。

你不需要等待电信公司建设宽带网络或消费者购买新设备，生成式 AI 构建在整个现有的云端、分布式计算以及过去十年中构建起来的很多机器学习技术之上。对用户而言，它只是一个网站。

然而，如果你考虑到这些图表的含义，可能会有不同的期望。来自 Productiv 和 Okta（采用不同的方法）的报告显示，他们典型客户现在拥有数百种不同的软件应用程序，企业客户则拥有近 500 种。

然而，企业的云采用率仍然只占工作流程的四分之一不到。

这对工作场所中的生成式人工智能意味着什么？无论你认为会发生什么，都需要数年时间，而不是数周时间。

人们用来完成工作的工具以及可能现在获得新的自动化的任务都非常复杂和专业，并且蕴含了大量的工作和机构知识。

很多人正在尝试使用 ChatGPT，并观察它能做什么。如果你正在阅读这篇文章，你可能也在使用它。这并不意味着 ChatGPT 已经取代了他们现有的工作流程，替换或自动化任何这些工具和任务都不是轻而易举的事情。

一个令人惊叹的变革性技术演示和一家大型复杂公司可以使用的东西之间存在着巨大的区别（译者注：也就是我在之前文章里一直说的技术可用和商业可用之间存在巨大差距）。

你很少能去一家律师事务所，向他们销售 GCP 翻译或情感分析的 API 密钥：你需要将其包装在控制、安全性、版本管理、客户特权以及其他只有合法软件公司才了解的许多其他因素中（过去十年里有许多机器学习公司都曾经历过这个坟场）。

公司通常无法购买"技术"，Everlaw 不销售翻译服务，People.ai 也不销售情感分析，他们销售工具和产品，而 AI 通常只是其中的一部分。我认为一个文本提示、一个"开始"按钮和一个黑盒子式通用文本生成引擎并不能构成一个产品，而产品需要时间来打造。

与此同时，购买管理大型复杂事物的工具即使在工具构建完成并具备产品市场适配性后，也需要时间。构建企业软件的创业公司面临的最基本挑战之一是，初创公司运行周期平均为 18 个月，而许多企业决策周期也为 18 个月。

SaaS 本身加速了这一进程，因为你无需进入企业数据中心部署计划，但你仍需要购买、集成和培训，而拥有数百万客户和数十万或数百万员工的公司有非常充分的理由不突然改变事情。未来需要时间，而硅谷以外的世界是复杂的。

第二个反驳观点是 ChatGPT 和 LLMs 的范式转变部分是在抽象层面上进行的：这看起来更像一种更通用的技术。确实，这就是为什么它令人兴奋的原因。据说它可以回答任何问题。所以，你可以看一下那张包含 473 个企业 SaaS 应用程序的图表，并说 ChatGPT 将会打破并合并许多垂直应用程序到一个提示框中。这意味着它将变得更快，并且自动化程度也会更高。

我认为这误解了问题。如果律师事务所的合伙人想要一篇论文的初稿，他们希望能够以完全不同的方式塑造参数，与保险公司销售人员挑战索赔时可能使用不同的训练集和肯定使用不同的工具。

Excel 也是"通用"的，SQL 也是如此，但有多少种不同类型的"数据库"？这就是我认为 LML（大型语言模型）未来发展方向应该从提示框转向图形用户界面（GUI）和按钮的原因之一：我认为"提示工程"和"自然语言"是互相矛盾的。但无论哪种方式，即使你可以将所有内容都作为一个巨大基础模型上薄薄包装运行（对此几乎没有共识或清晰度），即使这些包装器也需要时间。

事实上，虽然有人可能会认为 LLMs 将在一个方面上取代许多应用程序，但我认为同样有可能它们将在其他方面上带来全新的解构浪潮，因为初创公司从 Word、Salesforce 和 SAP 中剥离出更多的应用场景，并通过解决人们甚至没有意识到是问题的问题而建立更多大型企业。这个过程可以解释为什么如今大公司已经拥有 400 个 SaaS 应用程序。

更基本的是错误率。 ChatGPT 可以尝试回答"任何问题"，但答案可能是错误的。人们称之为幻觉、凭空捏造、撒谎或胡扯------这就是"过于自信的大学生"问题。我认为这些都不是有益的框架：我认为最好的理解方式是，当你在提示中输入一些内容时，实际上并没有要求它回答一个问题。相反，你正在询问它："人们对类似问题会产生什么样的答案？"你在要求它匹配一个模式。

因此，如果我要求 GPT-4 写一篇关于我的传记，然后再次询问它，它会给出不同的答案。它回答说我曾就读于剑桥大学、牛津大学或伦敦政治经济学院。这些总是正确的模式：这是正确类型的大学和工作（它从不说麻省理工学院然后是餐饮管理）。它对"像 Benedict 这样的人可能做过什么样工作和拿过什么样的学位？"这个问题给出了 100% 正确的答案。它不是在进行数据库查找：它正在生成一个模式。

你可以从 MidJourney 得到类似的情景。提示词是"A photograph of advertising people discussing creativity on stage in a panel on a beach at Cannes Lions"。

它几乎完美地匹配了模式 - 那看起来像戛纳的海滩，这些人穿得像广告人士，甚至发型也是对的。但它并不知道任何事情，所以它不知道人们从来没有三条腿，只是觉得这种可能性很小。这不是"撒谎"或"编造事实"，而是在不完美地匹配一个模式。

无论你如何称呼它，如果你不理解这一点，你可能会遇到麻烦，就像这位不幸的律师一样，他不明白当他要求先例时，他实际上是在要求看起来像先例的东西。他得到了看起来像先例的东西，但实际上并不是。这不是一个数据库。

如果你理解了这一点，那么你必须问自己，在哪些情况下 LLMs 有用？在哪些情况下拥有可以重复模式、需要检查的自动化本科生或自动化实习生有用？最后一波机器学习为你提供了无限数量可以替你阅读任何内容的实习生，但你仍然需要进行检查；现在我们拥有了能够为你撰写任何内容的无限数量实习生，但你仍然需要进行检查。所以，在哪些情况下拥有无限数量的实习生是有用的呢？去问问丹·布里克林吧------我们又回到杰文斯悖论了。

这显然让我想到了 AGI。对我刚才说的一切的真正基本的反对意见是问，如果我们有一个没有错误率、不会产生幻觉，并且确实可以做人类能做的任何事情的系统会发生什么。如果我们有了那个，那么你可能不需要一个会使用 Excel 的会计师来得到十个会计师的输出：你可能只需要机器。这一次，真的会不同。以前的自动化浪潮意味着一个人可以做更多的事情，现在你不需要这个人了。

然而，如果你不小心就会陷入循环中，就像许多 AGI 的问题一样。"如果我们有一台机器可以没有任何限制的做任何人类所做的事情，它能够在没有任何限制的情况下做人类能做的任何事情吗（If we had a machine that could do anything people do， without any of these limitations， could it do anything people can do， without these limitations）？"

好吧，确实如此，如果是这样的话，我们可能会遇到比中产阶级就业更大的问题，但是这离现实近吗？你可以花费几周时间观看三小时长的 YouTube 视频，看计算机科学家们争论这个问题，最终得出的结论是他们自己也不清楚。

你还可以提出一个观点：认为有一种神奇的软件能改变一切，并克服真实人员、真实公司和真实经济的复杂性，并且现在可以在几周内部署起来。听起来像是经典的技术解决方案主义，但从乌托邦变成了反乌托邦。

然而，作为分析师，我倾向于亨姆的经验主义胜过笛卡尔 - 我只能分析我们所知道的。我们没有 AGI，在没有它的情况下，我们只有另一波自动化浪潮，并且似乎没有任何先验理由认为这必定比之前的所有变革更加痛苦或者更加轻松。