大模型“诸神之战”，落地才是赛点

ChatGPT 诞生已经快一年，你还在与它对话吗？

有的人用来写报告、改代码，让它成为得力帮手；有的人却只是"调戏"个两三回，让它创作诗歌或故事，便不再"宠幸"。

根据网站分析工具 SimilarWeb 的数据，后者情况似乎更多。目前 ChatGPT 的月活数据已经连续三个月下滑，浏览量从四月的 17.6 亿下滑至八月的 14.3 亿，似乎开始有些过气。

一边是 ChatGPT 这样的通用大模型在退烧，一边是行业大模型研发热度只增不减。

国产大模型正在掀起一场"诸神之战"，然而不少企业都被卡在关键一步，那就是落地。

技术仅是门槛，落地才是赛点

和当年互联网"百团大战"比起来，这一回正在上演的"百模大战"要更内卷，也更烧钱。赛迪顾问数据显示，截至 2023 年 7 月，中国已累计有 130 个大模型问世 [1]。

《中国人工智能模型大地图研究报告》也指出，全国正有 14 个省（市）开展大模型研发。研发主体里，既有国内大学、科研机构，也有包括互联网巨头在内的企业，大佬们纷纷披甲上阵，准备迎接狂热的未来 [2]。

比起专业性弱的通用大模型，国内偏爱的行业大模型，基于各行业数据训练，结合专有知识和经验，更适用于具体场景的工作，能真正服务好千行万业。

但如果将大模型的问世比喻成研发的阶段性毕业，如今的现实情况是，没几个行业大模型能成功"上岗"。大模型能重塑行业，听起来似乎还是"空中楼阁"。

这其中最大的拦路石便是"落地难"。因为像"吞金兽"一样的 AI 大模型，训练成本真不是一般的高。没有雄厚的资金做支撑，很难商业落地。

由斯坦福大学发布的 2023 AI Index 年度报告，基于已有大模型披露的硬件和训练时间，对其训练成本进行了估算。

2019 年发布的 GPT-2，被认为是第一个大型语言模型，拥有 15 亿个参数，估计需要五万美元的训练费用 [3]。

仅仅三年时间，2022 年推出的旗舰大型语言模型之一的 PaLM 拥有 5400 亿个参数，估计成本在 800 万美元。它比 GPT-2 大了约 360 倍，成本也高出了 160 倍 [3]。大模型规模变得越来越庞大，但也愈发昂贵。

落地难的原因除了成本高昂，还有 AI 发展的基础"燃料"算力比较有限。

如果把大模型比较一辆车，那它能走多远，正是取决于算力这个引擎。训练大模型，需要将数据集进行重复多轮计算处理，算力大小就代表着数据处理能力的强弱。

面对大模型数量成倍的增长，这几年中国智能算力规模也正在经历井喷式高速增长。

根据 IDC 发布的《2022-2023 中国人工智能计算力发展评估报告》，2023 年中国智能算力规模已达到 427 每秒百亿亿次浮点运算。预计到 2026 年，智能算力规模将进入每秒十万亿亿次浮点运算级别 [4]。

早在今年 4 月 5 日，OpenAI 就以需求量过大为由，暂时关闭了 ChatGPT Plus 的付费渠道，这意味着仅发布几个月，OpenAI 就开始面临算力缺口 [5]。

大模型这场豪华游戏，能留在牌桌的玩家，注定只是少数。

所以别看大模型喧嚣盛极一时，但当面对成本、算力等现实问题时，国内外市场也正在出现更多理智思考------无法落地商用的通用大模型只能是玩具，成为企业应用的行业大模型才有产业价值 [6]。

AI 深入行业，

知识计算是关键

在国内，从华为云盘古大模型、阿里通义千问，再到 360 智慧大脑、智谱 AI ChatGLM 等，AI 大模型层出不穷。

不少人开始好奇《流浪地球》里不断学习，变得无所不能的最高人工智能莫斯是不是要走进现实了？

也有人担心有朝一日自己的饭碗会不会被 AI 抢走？但从麦肯锡全球研究院调研数据看，下此定论为时尚早。在 2020 年的人工智能全球调研中，AI 在不同行业的平均渗透率为 12.8%，处于较低水平 [7]。

更关键的是，AI 大模型和打工人并非互相取代的关系。而是大模型带来的新机会，能够提升工作效率、释放员工做更多高价值的事情。

为何现阶段的 AI 深入行业程度还不够？

原因是不同行业都有自己数十上百年的专业积累，却缺乏高效利用的方法。解决这个难题的关键，在知识计算。

所谓知识计算，华为云认为就是把各种形态的知识，通过 AI 技术进行抽取、表达后，协同大量数据进行计算，进而产生更为精准的 AI 模型，从而提高行业效率。

为了能提供满足行业场景的多项技能，华为云团队使用 40TB 的文本数据，包含大量通用知识与行业经验，训练盘古自然语言大模型，为行业大模型打下坚实基础。

下一个问题接踵而至------行业专家与 AI 专家合作时，双方如何互相听得懂？华为云的做法是派 200 个博士深入客户现场，"走田头、跑工地、下矿井、进车间"，抓住 AI 技术创新与业务需求的结合点，解决行业难题。

200 多个博士深入行业现场，抓住 Al 技术创新与业务需求的结合点

像汽车领域，为了找到盘古大模型和自动驾驶行业的切入点，华为云深入一线交流请教，梳理行业业务和技术痛点。

现有自动驾驶技术能应对 95% 的常见驾驶场景，剩余 5% 是各类不常见却不断出现的"长尾问题"，阻碍更高智能化的自动驾驶落地。

盘古汽车大模型基于超车线路构建不同的光照、天气、建筑，快速生成近百个样本，生成灵活编辑的虚拟空间，重塑自动驾驶的训练，让模型更好学习应对"长尾问题"。现在学习一个新的复杂场景，时间能从两周以上缩短到两天内。

除了汽车行业，华为云已陆续推出矿山、药物分子、电力、气象、海浪、铁路、政务、金融、制造等大模型，贡献先进的算法和解决方案，在行业内大展身手。

今年夏天，台风"泰利""杜苏芮""苏拉""海葵"先后接棒登陆沿海地区，路径复杂，影响范围广，致灾程度高。如果能精准预测台风路径、级别和经过的地方，就能提早做准备。

但气象预测一直是科研领域的重难点。而盘古气象大模型，不仅将预测时间从 4-5 小时缩短到十秒内，而且在精度上超过传统数值预报方法。

可以说，AI 预报的出现，给天气预报带来了全新可能。

大模型落地，

盘古还使哪些力

前面提到，训练大模型一天也离不开海量的算力。有人形容算力就像我们日常用的水和电一样，要"一点接入、即取即用"。

大模型热潮下，面对企业算力需求的爆发式增长，"算力饥渴"成为了亟待解决的问题。

华为云基于系统性的创新，升级现有数据中心架构，突破单台服务器部件的限制，拆解和重新组合原来以 CPU 为中心的主从架构，升级为各种资源对等的全互联架构------分布式 QingTian 架构。

分布式 QingTian 架构打破了算力、存储和网络的边界，不仅实现高性能 AI 算力，轻松应对万亿级大模型训练，还将助力各行各业直接上云，一步到位搭建业务，更快更稳更高效。

QingTian 架构是基于高速网络协议的分布式对等全互联架构

得益于这一 AI 算力基础设施，企业使用华为云昇腾 AI 云服务时，只需要通过一根光纤，便能直接在云上获取算力，随取随用，让大模型算力触手可及。

今年七月，华为云海宣布在乌兰察布和贵安上线昇腾 AI 云服务，提供更长稳的 AI 算力服务；还发布了乌兰察布汽车专区，为自动驾驶开发提供澎湃算力。

开放性是昇腾 AI 云服务的重要优势之一，除了支持盘古大模型，更适配业界主流的近一百个开源大模型。

例如，美图仅用一个月就将 70 个模型迁移到了华为云昇腾 AI 云服务，同时华为云和美图团队一起进行了算子的优化，AI 性能提升了 30%。

如何将大模型应用到行业具体业务和场景中？除了自己做落地，华为还希望构建起一个繁荣的生态。

大模型的创新，从来都不仅仅是模型自身的创新以及各项 AI 根技术的创新，在算力、算法、平台、应用、服务等方面都需要全链条生态伙伴和客户的参与。

打个比方，盘古大模型就像是各个行业通用的"轮子"，加入生态的伙伴都可以在车上找到自己的位置，共同助力，让这辆车跑得更快，行得更远。

为此，华为云开放了全方位的生态合作路径，希望团结伙伴加入盘古大模型全域协同生态体系，真正让 AI 重塑千行万业。

一直以来，华为云践行的就是做实事、做最难的事。

一方面深耕算力，打造强有力的算力底座，支撑人工智能事业发展；另一方面结合大模型，从通用大模型到行业大模型的研究创新，来让人工智能真正服务好千行万业。

9 月 20-22 日，华为全联接大会在上海举办，大会以"加速行业智能化"为主题，汇聚业界思想领袖、商业精英、技术大咖、先锋企业、运营商、生态伙伴以及开发者等产业伙伴，共同探讨智能化技术的发展方向和未来机遇，加速行业智能化。

华为云认为，人工智能的发展，关键要"走深向实"，赋能产业升级，服务好千行万业、服务好科学研究，唯有这样，才能共赢人工智能新时代。

如何学习大模型

现在社会上大模型越来越普及了，已经有很多人都想往这里面扎，但是却找不到适合的方法去学习。

作为一名资深码农，初入大模型时也吃了很多亏，踩了无数坑。现在我想把我的经验和知识分享给你们，帮助你们学习AI大模型，能够解决你们学习中的困难。

我已将重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习，等录播视频免费分享出来，需要的小伙伴可以扫取。

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向，东学一点西学一点，像只无头苍蝇乱撞，我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。

二、AI大模型视频教程

三、AI大模型各大学习书籍

四、AI大模型各大场景实战案例

五、结束语

学习AI大模型是当前科技发展的趋势，它不仅能够为我们提供更多的机会和挑战，还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型，我们可以深入了解深度学习、神经网络等核心概念，并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时，掌握AI大模型还能够为我们的职业发展增添竞争力，成为未来技术领域的领导者。

再者，学习AI大模型也能为我们自己创造更多的价值，提供更多的岗位以及副业创收，让自己的生活更上一层楼。

因此，学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。