AI的尽头真的是能源吗?

引言

近日,英伟达黄仁勋、OpenAI奥特曼等科技界大佬也表达了AI被能源制约的焦虑。

黄仁勋在一次公开演讲中指出,AI未来发展与光伏和储能紧密相连。他强调,不应仅仅关注计算力,而是需要更全面地考虑能源消耗问题。黄仁勋表示:"AI的尽头是光伏和储能!我们不能只想着算力,如果只考虑计算机,我们需要烧掉14个地球的能源。"

奥特曼认为,未来Al技术的发展将高度依赖于能源,特别是光伏和储能技术的进步。奥特曼表示,"未来AI的技术取决于能源,我们需要更多的光伏和储能。"

"AI的尽头是能源",观点一出,引发科技界热议,即便是在英伟达Blackwell架构单GPU性能在提高5倍,能耗下降25倍的"极致"能效表现下。

面对AI算力背后的巨量能源消耗,微软、谷歌、亚马逊等科技巨头都在积极寻求核能作为其数据中心的能源解决方案。核能发电因其在清洁性、稳定性等方面的显著优势,也正在多国强势回归。

AI耗电量远超预期

据《纽约客》杂志报道,据国外研究机构的报告,ChatGPT每天要响应大约2亿个请求,在此过程中消耗超过50万度电力(美国商业用电一度约为0.147美元50万度电相当于一天花费7.35万美元)。而每一个美国家庭的平均用电量只有29度,也就是说,ChatGPT每天用电量相当于1.7万个美国家庭的用电量。

**由于算力设备的冷却需求,AI的耗水量也让人瞠目结舌。**美国加州大学河滨分校的研究员任少雷一直在试图计算ChatGPT等生成式人工智能产品对环境的影响。任少雷的团队估计,每次你问ChatGPT 5到50个提示或问题时,它就会消耗500毫升的水。而这款聊天机器人有超过1亿的活跃用户,且当下大型科技公司均在争前恐后加快研发同类产品。

**算力的大规模部署和应用不仅消耗大量资源,同时也带来碳排放问题。**以数据中心碳排放为例,数据中心碳排放主要来源于IT设备、空调系统、电源系统、照明系统等电力消费产生的间接排放,根据生态环境部环境规划院发布的《中国区域电网二氧化碳排放因子研究(2023)》,目前我国各省平均电网排放因子约0.61千克/千瓦时,若2025年、2030年各省平均电网排放因子保持目前的水平不变,则2025年、2030年我国数据中心间接碳排放量将分别达到2.1亿吨、3.5亿吨。

如何解决

随着AI的进步、模型的增大,如何解决伴生而来的高耗能问题?

当下的重点在于开源,风能、光伏等可再生新能源被视作数据中心重要的能量池,核能尤其被寄予厚望。由于几乎无限的燃料供应、环境友好、能量密度高、安全性高,核聚变被视为解决能源危机和气候变化问题的关键技术。得益于多个国家和私营企业的积极参与以及技术突破,全球核聚变商业化的进展正在加速。如果成功实现商业化,它将为人类提供几乎无限的清洁能源。

随着AI的进步、模型的增大,如何解决伴生而来的高耗能问题?

开源:

当下的重点在于开源,风能、光伏等可再生新能源被视作数据中心重要的能量池,核能尤其被寄予厚望。由于几乎无限的燃料供应、环境友好、能量密度高、安全性高,核聚变被视为解决能源危机和气候变化问题的关键技术。得益于多个国家和私营企业的积极参与以及技术突破,全球核聚变商业化的进展正在加速。如果成功实现商业化,它将为人类提供几乎无限的清洁能源。

节流

由于模型本身的算法和架构,以及硬件优化均会让AI功耗在一定程度上降低,已经有一些解决大模型高能耗问题的思路,主要包括:

  1. 算法和模型优化

通过算法优化,如权重剪枝、量化等技术,以及模型压缩技术,减少模型的复杂度,同时保持或接近原有的性能。近年来提出的一些轻量级模型(如MobileNet)就是为了低功耗场景而设计的。

  1. 硬件优化

开发和使用更高效的AI专用硬件,如英伟达开发的GPU T4和A100,谷歌开发的TPU(Tensor Processing Unit),这些硬件专为AI任务设计,能够在更低的能耗下提供更高的计算效率。

  1. 训练、计算技巧

训练技巧是一种通过调整神经网络的训练过程来优化计算资源的方法。例如,分布式训练技术可以利用多台计算机分担大规模计算的负荷。另外,将AI计算任务从云端转移到边缘设备,这样可以减少数据传输所需的能量,并利用边缘设备的低功耗特性。

  1. 提高数据中心的能效

通过优化数据中心的设计和管理,提高电源使用效率。例如,使用更高效的冷却系统,或者通过AI技术动态调整数据中心的运行状态以降低能耗。

**国内大厂纷纷给出解决方案。**比如腾讯能源业务已独立成为一级部门,其数据中心部门还组建了专门绿色能源团队,应用自然冷却、液冷、三联供、余热回收等新兴节能技术,提高制冷效率以降低数据中心能耗。华为、京东、亚马逊等也纷纷入局智慧能源领域。

相关推荐
yaosheng_VALVE3 分钟前
探究全金属硬密封蝶阀的奥秘-耀圣控制
运维·eclipse·自动化·pyqt·1024程序员节
MrJson-架构师3 分钟前
15款行业大数据报告下载网站
大数据
葡萄爱4 分钟前
OpenCV图像分割
人工智能·opencv·计算机视觉
dami_king10 分钟前
SSH特性|组成|SSH是什么?
运维·ssh·1024程序员节
启明真纳15 分钟前
elasticache备份
运维·elasticsearch·云原生·kubernetes
苹果醋319 分钟前
SpringBoot快速入门
java·运维·spring boot·mysql·nginx
向阳逐梦23 分钟前
基于STM32F4单片机实现ROS机器人主板
stm32·单片机·机器人
老周聊架构28 分钟前
聊聊Flink:Flink的状态管理
大数据·flink
www_3dyz_com30 分钟前
人工智能在VR展览中扮演什么角色?
人工智能·vr
刘不二36 分钟前
大模型应用—HivisionIDPhotos 证件照在线制作!支持离线、换装、美颜等
人工智能·开源