AI的尽头真的是能源吗?

引言

近日,英伟达黄仁勋、OpenAI奥特曼等科技界大佬也表达了AI被能源制约的焦虑。

黄仁勋在一次公开演讲中指出,AI未来发展与光伏和储能紧密相连。他强调,不应仅仅关注计算力,而是需要更全面地考虑能源消耗问题。黄仁勋表示:"AI的尽头是光伏和储能!我们不能只想着算力,如果只考虑计算机,我们需要烧掉14个地球的能源。"

奥特曼认为,未来Al技术的发展将高度依赖于能源,特别是光伏和储能技术的进步。奥特曼表示,"未来AI的技术取决于能源,我们需要更多的光伏和储能。"

"AI的尽头是能源",观点一出,引发科技界热议,即便是在英伟达Blackwell架构单GPU性能在提高5倍,能耗下降25倍的"极致"能效表现下。

面对AI算力背后的巨量能源消耗,微软、谷歌、亚马逊等科技巨头都在积极寻求核能作为其数据中心的能源解决方案。核能发电因其在清洁性、稳定性等方面的显著优势,也正在多国强势回归。

AI耗电量远超预期

据《纽约客》杂志报道,据国外研究机构的报告,ChatGPT每天要响应大约2亿个请求,在此过程中消耗超过50万度电力(美国商业用电一度约为0.147美元50万度电相当于一天花费7.35万美元)。而每一个美国家庭的平均用电量只有29度,也就是说,ChatGPT每天用电量相当于1.7万个美国家庭的用电量。

**由于算力设备的冷却需求,AI的耗水量也让人瞠目结舌。**美国加州大学河滨分校的研究员任少雷一直在试图计算ChatGPT等生成式人工智能产品对环境的影响。任少雷的团队估计,每次你问ChatGPT 5到50个提示或问题时,它就会消耗500毫升的水。而这款聊天机器人有超过1亿的活跃用户,且当下大型科技公司均在争前恐后加快研发同类产品。

**算力的大规模部署和应用不仅消耗大量资源,同时也带来碳排放问题。**以数据中心碳排放为例,数据中心碳排放主要来源于IT设备、空调系统、电源系统、照明系统等电力消费产生的间接排放,根据生态环境部环境规划院发布的《中国区域电网二氧化碳排放因子研究(2023)》,目前我国各省平均电网排放因子约0.61千克/千瓦时,若2025年、2030年各省平均电网排放因子保持目前的水平不变,则2025年、2030年我国数据中心间接碳排放量将分别达到2.1亿吨、3.5亿吨。

如何解决

随着AI的进步、模型的增大,如何解决伴生而来的高耗能问题?

当下的重点在于开源,风能、光伏等可再生新能源被视作数据中心重要的能量池,核能尤其被寄予厚望。由于几乎无限的燃料供应、环境友好、能量密度高、安全性高,核聚变被视为解决能源危机和气候变化问题的关键技术。得益于多个国家和私营企业的积极参与以及技术突破,全球核聚变商业化的进展正在加速。如果成功实现商业化,它将为人类提供几乎无限的清洁能源。

随着AI的进步、模型的增大,如何解决伴生而来的高耗能问题?

开源:

当下的重点在于开源,风能、光伏等可再生新能源被视作数据中心重要的能量池,核能尤其被寄予厚望。由于几乎无限的燃料供应、环境友好、能量密度高、安全性高,核聚变被视为解决能源危机和气候变化问题的关键技术。得益于多个国家和私营企业的积极参与以及技术突破,全球核聚变商业化的进展正在加速。如果成功实现商业化,它将为人类提供几乎无限的清洁能源。

节流

由于模型本身的算法和架构,以及硬件优化均会让AI功耗在一定程度上降低,已经有一些解决大模型高能耗问题的思路,主要包括:

  1. 算法和模型优化

通过算法优化,如权重剪枝、量化等技术,以及模型压缩技术,减少模型的复杂度,同时保持或接近原有的性能。近年来提出的一些轻量级模型(如MobileNet)就是为了低功耗场景而设计的。

  1. 硬件优化

开发和使用更高效的AI专用硬件,如英伟达开发的GPU T4和A100,谷歌开发的TPU(Tensor Processing Unit),这些硬件专为AI任务设计,能够在更低的能耗下提供更高的计算效率。

  1. 训练、计算技巧

训练技巧是一种通过调整神经网络的训练过程来优化计算资源的方法。例如,分布式训练技术可以利用多台计算机分担大规模计算的负荷。另外,将AI计算任务从云端转移到边缘设备,这样可以减少数据传输所需的能量,并利用边缘设备的低功耗特性。

  1. 提高数据中心的能效

通过优化数据中心的设计和管理,提高电源使用效率。例如,使用更高效的冷却系统,或者通过AI技术动态调整数据中心的运行状态以降低能耗。

**国内大厂纷纷给出解决方案。**比如腾讯能源业务已独立成为一级部门,其数据中心部门还组建了专门绿色能源团队,应用自然冷却、液冷、三联供、余热回收等新兴节能技术,提高制冷效率以降低数据中心能耗。华为、京东、亚马逊等也纷纷入局智慧能源领域。

相关推荐
宅小海2 小时前
scala String
大数据·开发语言·scala
朝九晚五ฺ2 小时前
【Linux探索学习】第十四弹——进程优先级:深入理解操作系统中的进程优先级
linux·运维·学习
小白的白是白痴的白2 小时前
11.17 Scala练习:梦想清单管理
大数据
java1234_小锋2 小时前
Elasticsearch是如何实现Master选举的?
大数据·elasticsearch·搜索引擎
Kkooe3 小时前
GitLab|数据迁移
运维·服务器·git
久醉不在酒3 小时前
MySQL数据库运维及集群搭建
运维·数据库·mysql
ZHOU_WUYI4 小时前
3.langchain中的prompt模板 (few shot examples in chat models)
人工智能·langchain·prompt
如若1234 小时前
主要用于图像的颜色提取、替换以及区域修改
人工智能·opencv·计算机视觉
老艾的AI世界4 小时前
AI翻唱神器,一键用你喜欢的歌手翻唱他人的曲目(附下载链接)
人工智能·深度学习·神经网络·机器学习·ai·ai翻唱·ai唱歌·ai歌曲
DK221514 小时前
机器学习系列----关联分析
人工智能·机器学习