AI的尽头真的是能源吗?

引言

近日,英伟达黄仁勋、OpenAI奥特曼等科技界大佬也表达了AI被能源制约的焦虑。

黄仁勋在一次公开演讲中指出,AI未来发展与光伏和储能紧密相连。他强调,不应仅仅关注计算力,而是需要更全面地考虑能源消耗问题。黄仁勋表示:"AI的尽头是光伏和储能!我们不能只想着算力,如果只考虑计算机,我们需要烧掉14个地球的能源。"

奥特曼认为,未来Al技术的发展将高度依赖于能源,特别是光伏和储能技术的进步。奥特曼表示,"未来AI的技术取决于能源,我们需要更多的光伏和储能。"

"AI的尽头是能源",观点一出,引发科技界热议,即便是在英伟达Blackwell架构单GPU性能在提高5倍,能耗下降25倍的"极致"能效表现下。

面对AI算力背后的巨量能源消耗,微软、谷歌、亚马逊等科技巨头都在积极寻求核能作为其数据中心的能源解决方案。核能发电因其在清洁性、稳定性等方面的显著优势,也正在多国强势回归。

AI耗电量远超预期

据《纽约客》杂志报道,据国外研究机构的报告,ChatGPT每天要响应大约2亿个请求,在此过程中消耗超过50万度电力(美国商业用电一度约为0.147美元50万度电相当于一天花费7.35万美元)。而每一个美国家庭的平均用电量只有29度,也就是说,ChatGPT每天用电量相当于1.7万个美国家庭的用电量。

**由于算力设备的冷却需求,AI的耗水量也让人瞠目结舌。**美国加州大学河滨分校的研究员任少雷一直在试图计算ChatGPT等生成式人工智能产品对环境的影响。任少雷的团队估计,每次你问ChatGPT 5到50个提示或问题时,它就会消耗500毫升的水。而这款聊天机器人有超过1亿的活跃用户,且当下大型科技公司均在争前恐后加快研发同类产品。

**算力的大规模部署和应用不仅消耗大量资源,同时也带来碳排放问题。**以数据中心碳排放为例,数据中心碳排放主要来源于IT设备、空调系统、电源系统、照明系统等电力消费产生的间接排放,根据生态环境部环境规划院发布的《中国区域电网二氧化碳排放因子研究(2023)》,目前我国各省平均电网排放因子约0.61千克/千瓦时,若2025年、2030年各省平均电网排放因子保持目前的水平不变,则2025年、2030年我国数据中心间接碳排放量将分别达到2.1亿吨、3.5亿吨。

如何解决

随着AI的进步、模型的增大,如何解决伴生而来的高耗能问题?

当下的重点在于开源,风能、光伏等可再生新能源被视作数据中心重要的能量池,核能尤其被寄予厚望。由于几乎无限的燃料供应、环境友好、能量密度高、安全性高,核聚变被视为解决能源危机和气候变化问题的关键技术。得益于多个国家和私营企业的积极参与以及技术突破,全球核聚变商业化的进展正在加速。如果成功实现商业化,它将为人类提供几乎无限的清洁能源。

随着AI的进步、模型的增大,如何解决伴生而来的高耗能问题?

开源:

当下的重点在于开源,风能、光伏等可再生新能源被视作数据中心重要的能量池,核能尤其被寄予厚望。由于几乎无限的燃料供应、环境友好、能量密度高、安全性高,核聚变被视为解决能源危机和气候变化问题的关键技术。得益于多个国家和私营企业的积极参与以及技术突破,全球核聚变商业化的进展正在加速。如果成功实现商业化,它将为人类提供几乎无限的清洁能源。

节流

由于模型本身的算法和架构,以及硬件优化均会让AI功耗在一定程度上降低,已经有一些解决大模型高能耗问题的思路,主要包括:

  1. 算法和模型优化

通过算法优化,如权重剪枝、量化等技术,以及模型压缩技术,减少模型的复杂度,同时保持或接近原有的性能。近年来提出的一些轻量级模型(如MobileNet)就是为了低功耗场景而设计的。

  1. 硬件优化

开发和使用更高效的AI专用硬件,如英伟达开发的GPU T4和A100,谷歌开发的TPU(Tensor Processing Unit),这些硬件专为AI任务设计,能够在更低的能耗下提供更高的计算效率。

  1. 训练、计算技巧

训练技巧是一种通过调整神经网络的训练过程来优化计算资源的方法。例如,分布式训练技术可以利用多台计算机分担大规模计算的负荷。另外,将AI计算任务从云端转移到边缘设备,这样可以减少数据传输所需的能量,并利用边缘设备的低功耗特性。

  1. 提高数据中心的能效

通过优化数据中心的设计和管理,提高电源使用效率。例如,使用更高效的冷却系统,或者通过AI技术动态调整数据中心的运行状态以降低能耗。

**国内大厂纷纷给出解决方案。**比如腾讯能源业务已独立成为一级部门,其数据中心部门还组建了专门绿色能源团队,应用自然冷却、液冷、三联供、余热回收等新兴节能技术,提高制冷效率以降低数据中心能耗。华为、京东、亚马逊等也纷纷入局智慧能源领域。

相关推荐
何中应10 分钟前
vmware的linux虚拟机如何设置以命令行方式启动
linux·运维·服务器
LOnghas121117 分钟前
电动汽车充电接口自动识别与定位_yolo13-C3k2-Converse_六种主流充电接口检测分类
人工智能·目标跟踪·分类
编码小哥19 分钟前
OpenCV图像滤波技术详解:从均值滤波到双边滤波
人工智能·opencv·均值算法
江畔何人初20 分钟前
kubernet与docker的关系
linux·运维·云原生
阿杰学AI21 分钟前
AI核心知识78——大语言模型之CLM(简洁且通俗易懂版)
人工智能·算法·ai·语言模型·rag·clm·语境化语言模型
新缸中之脑32 分钟前
氛围编程一个全栈AI交易应用
人工智能
码云数智-大飞36 分钟前
Oracle RAS:AI时代守护企业数据安全的智能盾牌
数据库·人工智能·oracle
余俊晖36 分钟前
Qwen3-VL-0.6B?Reyes轻量化折腾:一个从0到1开始训练的0.6B参数量的多模态大模型
人工智能·自然语言处理·多模态
bubuly40 分钟前
软件开发全流程注意事项:从需求到运维的全方位指南
大数据·运维·数据库
zuozewei40 分钟前
7D-AI系列:DeepSeek Engram 架构代码分析
人工智能·架构