打响反对人工智能的第一枪

序言: 人工智能的讨论不能只有一片叫好的声音,一味的追捧反而可能隐藏巨大的危机。因此,必须有反对的声音,且越强烈越能激发深入思考。本篇文章的作者就以犀利的视角,漂亮地打响了反对人工智能应用的第一枪。

我以前一直以为人工智能的狂热会自然消退,也许等泡沫不可避免地破灭时会引起一些经济问题。但是现在我不这么想了。我现在把这种AI狂热看作是某种更隐蔽、更有害、更具破坏性的社会问题的表现。听起来有点夸张?好吧,让我解释一下。

几周前,《The Information》透露OpenAI可能面临破产,因为他们预计到年底会有50亿美元的亏损。不仅如此,他们的AI开发成本预计从每年约30亿美元飙升到超过70亿美元,以便构建对其发展和生存至关重要的更大、更强的模型。简单地说,OpenAI正在失血,等待死亡。但在这个消息传出后不久,OpenAI宣布他们正在寻求65亿美元的投资,使公司估值达到1500亿美元,几乎是年初估值的两倍,并试图从银行获得50亿美元的贷款。如果成功的话,这些资金最多只能让OpenAI再维持一年。而更糟的是,有很多证据表明,即使获得这些资金,OpenAI也无法制造出这些改进的模型,更无法实现盈利(这一点我们稍后会详细讨论)。

你可能会觉得没人会给OpenAI这么大一笔钱吧?错了!OpenAI刚刚宣布,他们从英伟达、微软、软银和Thrive Capital筹集了66亿美元的投资,估值达到1570亿美元,还从摩根大通、高盛、摩根士丹利、桑坦德银行、富国银行、三井住友、瑞银和汇丰等获得了40亿美元的无担保滚动信贷。

那么,为什么这些最大的公司、投资机构和投资银行要给OpenAI注入如此巨额资金呢?是因为这是本世纪最好的商业机会吗?还是另有原因?

好吧,让我们来看看OpenAI的基本情况,看看这是否是一个好的投资机会(提示:绝对不是)。

首先,正如我们之前简要提到的,OpenAI并不盈利。再次强调,他们预计到年底将亏损50亿美元,而今年的AI开发支出约为30亿美元。这意味着,即使他们拥有数亿用户,并且远超每一个收入预测,他们离盈利仍相距甚远。但即使他们花费零美元来开发更好的AI(而公司估值完全是基于这些模型),目前的AI运营成本依然极高,导致每年仍然会有数十亿美元的亏损。

总的来说,OpenAI的商业基本面糟糕透顶。但是如果OpenAI有办法在未来显著增加收入并降低成本,那么尽管财务状况不佳,还是可以有理由投资数十亿美元。

不幸的是,事实并非如此。

首先,正如我在之前的文章中提到的,AI的发展正遭遇严重的收益递减现象。简而言之,为了让AI继续保持现有的进步速度,训练数据、基础设施和能源消耗必须呈指数增长。这意味着OpenAI和其他AI公司正在遇到严重的瓶颈。而最主要的瓶颈就是支出,这意味着如果AI要保持现有的发展速度,其开发、构建和维护的成本将呈指数增长!

现在,像OpenAI这样的公司有深厚的财力,但并没有那么深厚。因此,AI的发展开始停滞。你可以从他们的ChatGPT模型中看出这一点。从1.0版到3.5版,每个版本都是一个巨大的进步,但从3.5到4.0,再到4.0到o1的区别微乎其微。实际上,很多改动并不是在提高AI的性能,而是在改善AI的可用性。

这也是为什么预计OpenAI每年要花费70亿美元进行AI训练;他们必须大幅度扩展开发才能保持一点点的前进步伐。

即使OpenAI能够筹集到开发下一代AI所需的惊人资金,问题也不会因此得到解决。首先,这只会让他们离盈利更远,因为成本会继续上升而不是下降。其次,他们还面临"模型崩溃"的风险。

当你用AI生成的数据训练AI时,模型会迅速失稳,最终生成无意义的胡言乱语。这是因为AI生成的内容中包含了人类生成内容中不存在的、几乎无法察觉的小趋势。当你用这些内容训练AI时,它会逐渐赋予这些无意义的趋势更大的权重,最终导致AI所基于的整个统计模型崩溃。

OpenAI已经从互联网上收集了数十亿行文本用于训练其ChatGPT模型,这些文本曾经是人类创作内容的绝佳资源。然而,随着ChatGPT的使用变得越来越普遍,在线上的应用也越来越多。目前,估计超过13%的Google搜索结果是由AI生成的,这个比例还会继续增长。然而,其中绝大多数AI生成内容没有被标记,也不明显。因此,如果OpenAI继续从网络上抓取数据,就会面临灾难性的模型崩溃风险。

为了防止这种情况发生,OpenAI和其他AI公司已经转向了高质量的数据源,比如书籍或视频转录文本。然而,这些作品有更大的出版商和版权持有者来进行反击。

这些AI公司在获取训练数据方面处于灰色地带。他们声称可以根据"合理使用"原则,在未经许可或支付的情况下获取这些数据并进行训练。版权法中的这一部分主张,个人或实体可以出于评论目的或进行转化时使用受版权保护的材料。然而,使用他人的数据训练AI,本质上使AI能够以近乎零成本复制那个人的作品,有时甚至是完全相同的,这违反了版权法的本意。此外,有一种说法认为,以这种方式使用数据属于"不当得利",这种法律原则是为了防止某人或公司在未支付报酬的情况下,从他人的劳动或工作中牟利。因此,一些大公司,如华纳兄弟和索尼,正在起诉这些AI公司,要么停止使用其受版权保护的数据,要么为这些材料支付数百万美元的费用。实际上,整个AI行业面临着越来越多的诉讼。

因此,很有可能在一两年内,OpenAI将不得不放弃大部分用于其模型的数据,因为版权法最终将被用来对付他们。

但即使这一切没有发生,OpenAI的产品也永远不会足够可靠,无法实现他们声称的无人监督的自动化。新的数据显示,当你为AI提供更多数据进行训练时,它在特定任务上的表现会更好,但在通用任务上的表现反而会变差。简而言之,无法通过更多的数据来解决AI的错误或幻觉问题。因此,即使他们真的开发出这些下一代AI,也仍然需要大量的人类监督才能完成基础工作,这完全颠覆了这种技术将改变每个行业的核心承诺。

以计算机编程为例。这本应是AI最容易颠覆的行业之一。但事实并非如此。当然,这些AI的编码速度可以比最快的程序员快十倍。然而,他们生成的代码中充满了错误和漏洞,调试这些代码所需的时间比调试人类程序员的代码要多得多。总体来说,人类程序员实际上效率更高,成本也更低。

除非OpenAI能够彻底消除这些错误,而目前他们和整个AI行业都无法做到这一点,否则这将始终是他们产品和整个AI行业的致命问题。

所以,如果是这样,AI的实际用途是什么呢?

有很多AI被宣传为完全自动化了某些工作,比如Cruise的自动驾驶出租车或亚马逊的无收银结账商店。但这些公司必须雇用和被替代工作数量一样多的人来监督这些AI,即便如此,服务质量也更差,总成本比最初雇佣人类来完成工作还要高。当你真正细化到商业规划中,几乎没有哪个AI的应用案例可以让消费者、企业和AI提供商都获得良好的服务并保持盈利。

那些刚刚向OpenAI注资数十亿美元的公司和银行知道这些全部的情况。他们雇用了世界上最优秀的市场和技术分析师,专门用来理解这些细节。那么,为什么他们还要如此大规模地投资于这样一个显而易见正在沉船的公司呢?

很简单,我对OpenAI的所有分析都建立在我们生活在一个精英选拔社会的前提下。但我们并不生活在这样一个社会中。我们的资本主义社会正越来越偏向一个垄断的、权力饥渴的、富人统治的体制。

他们知道,自动驾驶出租车、AI记者、AI人力资源机器人、AI程序员等都比人类做得更糟糕,也无法盈利,但他们不在乎。他们可以生产和交付比人类更多的东西,通过向市场投放大量劣质产品淹没竞争对手。这样就可以通过蛮力,而不是通过优胜劣汰的原则来有效地占据大量市场份额。这会加强大科技公司和媒体的近乎垄断地位,这些公司和媒体正是这些银行和企业所喜爱并大力投资的------事实上,他们中的一些就是近乎垄断的,例如微软。

这就是AI推动的现实。这是由我们的金融行业和近乎垄断的大公司那种去人性化、权力饥渴的法西斯倾向所导致的。他们只想要更多的权力,不管后果如何。

所以,他们向一种技术投资了数十亿美元,而这种技术正在消除我们社会和经济在过去几个世纪中赖以繁荣的那点精英选拔制度。它通过淹没竞争对手来贬低和去人性化工作,使得这些投资者所拥有巨大股份的近乎垄断的企业不再需要努力提供更好的服务来保持领先地位。相反,他们可以利用大量资金淹没竞争对手,安于现状。对这些投资者来说,OpenAI是否盈利并不重要;重要的是它可以给他们带来更多的权力和市场控制。

简而言之,以这种方式使用AI实际上削弱了资本主义者所宣称的自由市场力量,取而代之的是不公平的权力集中。

与此同时,受苦的就是我们,世界的公民。我们的工作被取代或贬值,本该用于更重要领域的投资被投入AI,我们所依赖的产品和服务质量下降到几乎无法使用的地步,我们的生活质量也因此下降。

这不是夸张;这已经在发生了。还记得我说的程序员吗?由于AI的影响,过去一年中程序员的职位空缺急剧减少。与此同时,随着同一时期内编程质量的显著下降,抱怨的声音越来越大。

这就是为什么我对AI感到恐惧。它不是一项革命性技术。它是我们现代社会核心腐朽的表现。像OpenAI这样的公司之所以能够存在,是因为那些已经统治我们生活的巨型公司愿意去人性化并致命地损害社会,只为了获得哪怕是一点点更多的权力和控制。他们想要一个无所不能的王座,哪怕统治的是一个支离破碎的世界。毫无疑问,当这些模型崩溃或者训练数据被撤回时,这座空中楼阁最终会倒塌。而且在他们被阻止之前,他们会通过驱逐人才或抹去技能和知识,对许多行业造成无法估量的伤害。但只要他们还能掌握那种权力,他们就不在乎。

相关推荐
B站计算机毕业设计超人37 分钟前
计算机毕业设计PySpark+Hadoop中国城市交通分析与预测 Python交通预测 Python交通可视化 客流量预测 交通大数据 机器学习 深度学习
大数据·人工智能·爬虫·python·机器学习·课程设计·数据可视化
学术头条41 分钟前
清华、智谱团队:探索 RLHF 的 scaling laws
人工智能·深度学习·算法·机器学习·语言模型·计算语言学
18号房客1 小时前
一个简单的机器学习实战例程,使用Scikit-Learn库来完成一个常见的分类任务——**鸢尾花数据集(Iris Dataset)**的分类
人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理·sklearn
feifeikon1 小时前
机器学习DAY3 : 线性回归与最小二乘法与sklearn实现 (线性回归完)
人工智能·机器学习·线性回归
游客5201 小时前
opencv中的常用的100个API
图像处理·人工智能·python·opencv·计算机视觉
古希腊掌管学习的神1 小时前
[机器学习]sklearn入门指南(2)
人工智能·机器学习·sklearn
凡人的AI工具箱1 小时前
每天40分玩转Django:Django国际化
数据库·人工智能·后端·python·django·sqlite
咸鱼桨2 小时前
《庐山派从入门到...》PWM板载蜂鸣器
人工智能·windows·python·k230·庐山派
喝醉酒的小白2 小时前
Elasticsearch(ES)监控、巡检及异常指标处理指南
大数据·elasticsearch·搜索引擎
强哥之神2 小时前
Nexa AI发布OmniAudio-2.6B:一款快速的音频语言模型,专为边缘部署设计
人工智能·深度学习·机器学习·语言模型·自然语言处理·音视频·openai