六、ChatGPT需要什么资源?

在ChatGPT走红之后,国内有很多的媒体和人一下子慌了神。特别是自媒体上,铺天盖地的都是说"为什么中国没有诞生ChatGPT"、"美国将要爆发一场新的技术革命"之类的文章。很多的一些研究机构和企业都宣称,我们马上就要推出自己的ChatGPT了。还有很多人觉得,ChatGPT给自己带来了新机会。(嘲讽)

但是,实际上,要实现一个ChatGPT既不必要,也不可能。为什么呢?不必要性,我们后面会慢慢展开讲。这一讲,先来谈谈不可能性。

我们前面讲到,ChatGPT的核心是语言模型,而语言模型是需要用大量的数据来训练的,有了数据后,还需要强大的算力支持,然后还需要有足够高水平的并行计算和机器学习的算法支持。数据、算力、算法三道坎,只有极少的互联网超级大厂能够越过去。

接下来我们分别从数据、算力和算法这三个方面来看看。

  1. 首先,数据是训练语言模型的首要资源。之前的Google训练自动问答的模型时,就用到了互联网上能找到的几乎所有高质量的数据,而现在的ChatGPT所用的数据量是极其庞大的,包括自媒体和社交网络上的数据。但是并不是每个企业都能得到所有这些数据,所以在这一点上就存在限制。
  2. 其次,是算力。训练语言模型需要强大的算力支持,这包括数据处理和训练过程。算力的需求在不断增加,即使使用了大量GPU等硬件,所需的计算资源也非常庞大,超过了大多数企业的能力范围。

早期的语言模型算法非常简单,主要是基于文本的统计和简单数学公式,用于计算词在不同上下文条件下的概率,并预先保存这些信息。然而,随着人们意识到简单统计无法覆盖所有语言现象,尤其是之前未见过的现象,开始着手深度挖掘语言中的语法和语义信息,这需要更大的计算量。

具体来说,计算量需要增加100万倍到1亿倍是合理的估计。虽然摩尔定律让计算成本逐渐下降,但人工智能的要求和所需算力不断提高,算力始终是一个瓶颈。

为了开发复杂的语言模型,研究者们甚至争取到了美国国家科学基金会(NSF)和美国国防部的经费支持,并获得了大量超级服务器的帮助。今天的ChatGPT采用的语言模型参数数量是早期模型的10万倍,比Google构建的模型大了1000倍。开发它所需的算力甚至可能是上百亿倍。

例如,开发GPT-3时,公司OpenAI的硬件成本超过了一亿美元,使用了约10万个GPU,提供超100PFLOPS(PFLOPS每秒所执行的浮点运算次数)的算力。这样的资源投入使得它可以为用户提供高质量的服务,但近期还不得不关闭付费用户的注册,以节约计算资源。而GPT-4的开发则需要更多的计算资源,包括使用了微软云计算的大量计算资源。

总之,训练语言模型需要强大的算力,这是ChatGPT成功的关键部分。

  1. 最后,我们来看算法。算力固然重要,但只有有配套的优质算法,才能发挥算力的作用。现今深度学习等算法已经是智能化数据中心的标配,而训练语言模型所需的机器学习算法十分复杂。除了算力,基础的自然语言处理技术也是实现ChatGPT的必要条件。

最直观的例子,你想让计算机回答问题,至少要让它懂得问题。你要想让它从上千亿的文本中知道哪些可能是答案,需要做到问题和答案的匹配。这个工作不是一年半载就能完成的。

今天,很多机器学习的算法已经开源了,有些应用已经有公司和研究机构投入科研力量开发过,比如基本的图形识别和语音识别技术,但是深度的自然语言理解其实还不属于这个范畴。在这些领域所具有的技术积累,其实也是一种资源。

有一些公司和研究机构在这个领域长期投入,拥有技术积累,比如:Google、微软,中国的百度、字节跳动等,它们或许能在较短时间内做出类似ChatGPT的产品。但是对于没有足够技术资源的人来说,跟风ChatGPT很可能是无知者无畏或纯粹的炒作。

今天,训练语言模型用到的机器学习算法要复杂很多。

2010年的时候,Google推出了一个基于云计算平台深度学习的工具------Google大脑。采用这个工具,语言模型的效果可以大幅提升,在其它条件不变的情况下,语音识别和机器翻译的相对错误率可以降低10%以上。深度学习的基本算法和支持它的基础架构,已经是智能化的数据中心,有些地方也称之为"智算平台"的标配。如果只是用一个由处理器,包括GPU,堆砌起来的数据中心训练语言模型,得到的结果会差很多。

综上所述,训练语言模型的三个限制分别是数据、算力和算法。所以,要实现一个ChatGPT,并不是简单的事情,需要巨大的资源支持。而对于一般企业或个人来说,可能并不具备这些条件,所以盲目跟风可能并不明智。

总结一下:训练语言模型的三个限制,分别是数据、算力和算法:

1、数据:训练语言模型所需的数据量是极其庞大的。不是每个企业都能得到所有的这些数据。

2、算力:随着时间的推移,人们对人工智能的要求也在不断提高,需要的算力也在不断增加。

3、算法:除了算力之外,基础的自然语言处理技术,也就是算法,也是实现ChatGPT这些产品必不可少的条件。

我耀学IT\]:Patience is key in life

相关推荐
科威舟的代码笔记6 分钟前
OpenClaw 权限风险深度剖析与 AI Agent 授权治理的技术思考
人工智能·openclaw
DeepModel12 分钟前
【特征选择】嵌入法(Embedded)
人工智能·python·深度学习·算法
云烟成雨TD12 分钟前
Spring AI 1.x 系列【14】三月双版本连发!Spring AI 最新功能全掌握
java·人工智能·spring
LaughingZhu16 分钟前
Product Hunt 每日热榜 | 2026-03-28
数据库·人工智能·经验分享·神经网络·chatgpt
nimadan1233 分钟前
**Minimax写小说软件2025推荐,AI辅助创作提升故事流畅度与情节合理性**
人工智能·python
码农三叔34 分钟前
第三卷:《人形机器人的控制与运动规划》
人工智能·机器人·人形机器人
小妖同学学AI36 分钟前
微软开源多智能体协作框架AutoGen:像组建公司一样,打造会“开会”的AI团队
人工智能·microsoft·开源
月巴月巴白勺合鸟月半1 小时前
FHIR 的使用
人工智能·c#·fhir
小吴同学·1 小时前
吴恩达机器学习下:二分类问题、逻辑回归、过拟合问题
人工智能·机器学习
程序员Shawn1 小时前
【机器学习 | 第四篇】- 逻辑回归
人工智能·机器学习·逻辑回归