麦肯锡:中国生成式AI市场现状和未来发展趋势

本文来自《麦肯锡中国金融业CEO季刊》,版权归麦肯锡所有。该季刊主要围绕生成式AI(以下简称"GenAI")主题,通过4大章节共8篇文章,全面深入分析了GenAI对各主要行业的影响、价值链投资机会、中国GenAI市场现状和未来趋势以及企业如何布局GenAI,从而真正挖掘其价值。

随着ChatGPT的火爆出圈,GenAI成为各行各业关注和热议的话题。全球科技巨头和AI厂商纷纷下场,唯恐错过此番科技盛宴。行业翘楚和媒体将GenAI浪潮类比昔日的移动互联网机遇,认为它将对全球经济和各个行业带来深远影响,企业也将迎来重大变革机遇。

GenAI蓬勃发展产业规模也在高速增长,投资者纷纷入局。2022年GenAI市场收入为400亿美元,预计2027年及2032年将分别达到3,990亿美元和13,040亿美元,2022~2032年复合增长率达42%。

中国市场,2022年规模约人民币660亿元,2020~2025年复合增速将达到84% ,2025年中国GenAI市场将占全球市场规模(2,170亿美元)的14%。

由于内容较多一共178页,下面主要为大家介绍中国GenAI市场现状和未来趋势。

市场规模

2022年全球GenAI市场整体收入为400亿美元,预计2027年及2032年将分别达到3990亿美元和1.3万亿美元,2022~2032年复合增长率高达42%。

到2025年,GenAI产生的数据将占所有生成数据的10%(2021年仅为1% 2)。

预计2022~2035年全球市场规模增量主要来源于训练侧硬件、广告应用和软件。其中,在训练侧硬件方面的增量约4,440亿美元,仅GenAI基础设施服务(GenAI as a service)一项,增量就有2,448亿美元,年复合增长率将达到60%;

在广告应用方面,相关年复合增长率将达到125%,增量达1924亿美元;而软件方面,在约2,800亿美元的增量中,GenAI助理软件增量可观,达890亿美元,年复合增长率有望达到70%。

2022年中国GenAI市场规模约人民币660亿元,预计2020~2025年复合增速将达84%,到2025年将占全球市场规模(2,170亿美元)的13%。

与此同时,近两年国内GenAI融资市场热度持续上升,前十大融资事件总规模达8.7亿美元。

其中,某领先的端到端AI制药公司、光某大模型初创公司等头部企业获得逾2亿美元的单笔融资,多轮融资累计规模分别超3亿美元、2.5亿美元。

技术栈

(一)专用硬件:基础建设资源受限,但国产化进程不断加速。

由于无法获得高端GPU(图形处理器)芯片A100与H100,国内大模型研发机构在算力上遭遇瓶颈。为应对上述困境,中国本土芯片研发厂商加强科研,在算力技术上实现重要突破。

目前,中国市场可以获得的A800 GPU芯片,传输速度仅为顶尖产品A100的70%。由于AI技术发展高度依赖先进GPU,需借助芯片进行大量模型训练和扩展,部分国内科研机构和科技企业因此受到较大影响,尤其在目前大模型参数量快速膨胀、算力需求显著增加的情况下。

为了应对算力瓶颈,国内领先算力芯片公司力求在产品端实现突破。例如,国内某量产商业人工智能芯片厂商,在头部大型云服务提供商旗下一款知识增强大语言模型产品中,实现了对部分业务场景的部署。

某专注于通用GPU芯片及解决方案研发及销售的高科技公司和另一计算机图形芯片设计公司则希望开发出接近高端芯片性能的产品。

全球领先的ICT(信息与通信)基础设施和智能终端提供商旗下的人工智能处理器则被用于内部大模型开发训练。

目前,国产GPU的算力规模大多在1000TOPS以内,上述某计算机图形芯片设计公司已能达到2000TOPS,但距离国际领先的H100芯片高达4000TOPS的算力仍有一定差距。

(二)云平台:全球竞争格局趋同,未来国内GenAI厂商将依赖云平台完成模型训练与调整。

在云平台领域,国内和海外市场均呈现头部厂商占据绝对主导地位的垄断格局。2022年,国内四家头部厂商占据国内79% 4的市场份额;在海外市场,截至2023年一季度,前三大厂商占据全球65%的市场份额。

通用大模型需要海量数据作训练用途,但中文网站数量从全球来看占比仅为1.4% (英文网站占比达54% ),可用作训练的公开中文语料库(含文本、图片、视频等素材)往往数量有限、质量不均。

与此同时,国内用户在网站和移动端App产生的海量数据,基于保护用户隐私的原因,大部分也未能应用在大模型训练上,对模型训练的效率和精度都造成不利影响。

尽管在训练数据上受到诸多限制,中国通用大模型技术仍然不断追赶国际领先水平,参数规模紧跟国际领先水准并实现快速提升。

相较于适用于多领域、多任务的通用大模型,行业大模型更依赖于开发者对垂直场景的理解和海量行业数据支持,在算力受限的背景下,行业大模型更有可能成为中国GenAI厂商的制胜赛道。

就行业大模型而言,国内市场正呈现差异化竞争格局:某头部互联网大厂的行业大模型根植于游戏、广告、内容创作等多媒体领域,成为提升广告和游戏场景创作效率的生产力工具;

国内前三的超大规模云服务商开发的产业级知识增强大模型则凭借其对中文语言的强大理解能力,赋能汽车行业售后服务与知识库构建、医疗行业单据识别、社科行业版权保护与词条管理等;

某全球领先的ICT(信息与通信)基础设施和智能终端提供商旗下的包含NLP、CV、多模态和科学计算的中文大模型则在工业物流、新药研发、气象预测等领域得到广泛应用。

(三)基础模型:通用大模型数量可观,行业大模型可能是国产GenAI的出路。

在通用大模型方面,截至2023年5月,中国已发布79个10亿参数级以上的大模型,在大模型发布数量上位居全球第二,仅次于美国。在全球模型发布数量前十的GenAI大模型厂商中,中国研发机构及厂商占据4席。

通用大模型需要海量数据作训练用途,但中文网站数量从全球来看占比仅为1.4% (英文网站占比达54% ),可用作训练的公开中文语料库(含文本、图片、视频等素材)往往数量有限、质量不均。

与此同时,国内用户在网站和移动端App产生的海量数据,基于保护用户隐私的原因,大部分也未能应用在大模型训练上,对模型训练的效率和精度都造成不利影响。

尽管在训练数据上受到诸多限制,中国通用大模型技术仍然不断追赶国际领先水平,参数规模紧跟国际领先水准并实现快速提升。

(四)模型库和工具:国内外围绕开源模型,涌现出大模型工具独立厂商。

海外市场围绕可自由调整代码的开源模型,已涌现出一批独立厂商,可实现模型训练和微调、模型部署、模型应用开发等细分技术功能。随着国内GenAI市场的不断发展,各种开发和维护工具等也将逐渐成熟。

(五)应用:中国创业公司尚处于早期阶段,聚焦领域相对集中。

中国GenAI领域的创业公司融资轮次靠前,集中在天使轮到Pre-A轮之间,融资金额大多小于1亿元人民币,正处于方兴未艾的发展初期,行业潜力巨大。

其中,某全球领先的跨国科技公司旗下的人工智能聊天机器人作为准独角兽企业,于2022年11月完成10亿元A+轮融资,投后估值约10亿美元。

反观海外GenAI行业,科创企业规模体量相对较大,涌现出多家细分应用领域独角兽企业,其中某总部位于伦敦的全球化AI研究型企业估值高达38亿美元。

中国GenAI垂直应用领域主要聚焦文本、图像和音视频生成,海外市场则在上述领域以外出现了大量基于GenAI的开发平台、数据分析平台及代码编写平台,其原因在于海外以早期程序语言(如COBOL)编写的系统较多,许多企业面临较高编程人力成本,因此对编程辅助软件有较高需求。

同时,目前中国GenAI企业目标客群多为终端用户,而海外市场存在大规模企业客户群体,随着中国SaaS市场成熟以及企业付费意愿提升,预计国内文本生成和图像生成初创企业将快速拓展至企业客户市场。

商业化应用

中国GenAI行业的商业化应用呈现出两大特点:一是行业分布集中,主要集中在商业化发展较成熟的优势产业;二是大部分企业尚处于积极探索自身商业模式的早期阶段。

(一)中国GenAI应用集中于商业化发展成熟的优势产业

中国GenAI企业利用国内垂直场景优势,将GenAI优先应用于商业化基础设施较完善的新兴行业中;而欧美同行则利用当地成熟的SaaS市场,将GenAI应用到高科技、通信及各种传统行业(如医疗、教育等),应用范围更加广泛。

在国内,GenAI应用发展最迅速的领域包括电商、传媒、娱乐和游戏,尤其是数字虚拟人和电商视频营销,而大部分传统行业(如金融、能源、教育等)仍处于小规模试点阶段。

GenAI应用得以在互联网电商平台蓬勃发展,原因在于中国拥有优质的电商和供应链生态以及庞大的消费者群体,为GenAI应用落地提供了契机。

典型的行业应用案例包括视频行业的某生成式AI的3D短视频内容厂商、电商行业的某领先GenAI视频大模型研发企业以及游戏行业的某互联网平台旗下的游戏与AI研究和应用机构等。

上述企业中,生成式AI的3D短视频内容厂商能够基于文本生成3D视频内容,并通过抖音、快手、B站等短视频平台进行推广,极大提高了短视频内容生产者的创作效率;

GenAI视频大模型研发企业则深耕电商行业,以AI生成虚拟人主播,赋能各行业、各品牌电商;游戏与AI研究和应用机构则利用人工智能打造AI陪玩、AI竞技机器人,并通过自然语言技术赋予非玩家角色人设,使其能够在游戏中与玩家互动对话。

(二)中国市场GenAI商业模式尚在探索中

目前,大部分中国市场的GenAI创业公司刚刚完成标准化产品输出,开始进入初级商业化探索阶段,市场上主流的商业模式包括云资源售卖、模型API调用、SaaS收费、素材收费等。

由于国内企业对软件的付费意愿不高、市场有待进一步培育,以及企业对SaaS部署方式存在数据安全方面的顾虑,大规模应用GenAI的商业模式仍有待探索。

在欧美市场,SaaS付费订阅模式已基本成熟,一众海外GenAI企业纷纷构建起可持续的SaaS商业模式。

风险管理

GenAI赋能各行各业的同时,也带来了诸如公平性受损、侵犯知识产权、信息泄露、恶意使用、安全威胁、模型幻觉及第三方风险等负面影响和挑战。其中,模型幻觉、恶意使用、信息泄露三大风险值得重点关注。

恶意使用:不当使用模型输出可能会带来欺诈、虚假信息传播等负面影响,中国GenAI应用丰富、用户群体庞大,所面临的恶意使用风险较为突出,但由于国内在实名认证,内容合规,和打击虚假信息等方面落实到位,有利于追溯恶意使用源头,从而防范和控制相关风险。

信息泄露:用于模型训练的隐私或敏感信息可能会被GenAI应用作为输出内容,同时人工智能模型存储系统内的个人信息也可能面临网络攻击和泄漏,因此需要在内部部署数据、又处于强监管下的重点行业和企业,需要主动防范信息泄露风险。

安全威胁:不仅负责任的AI(RAI-Responsible AI)受到监管和企业关注,安全的AI(SAI-Securing AI)也逐渐进入企业和公众视野,特别是AI系统全生命周期安全保护。有效的AI威胁管理直接影响到防范信息泄露和恶意使用。近期全国信息安全标准化技术委员会起草了相关评估规范和标准,为算法提供者给与了机器学习算法生命周期安全指导意见7,也可为监管评估提供参考。

模型幻觉:模型输出结果不符合事实。模型幻觉普遍存在于国内外所有的GenAI模型和应用,但因为国内大模型的研发经验和技术实力尚有提升空间,且中文语料相比英文更为复杂,让模型幻觉问题变得更加棘手。

为规范GenAI的应用,中国早在2022年已经开始布局AI相关监管,例如2022年3月发布了互联网信息服务算法推荐管理规定,2022年11月发布了互联网信息服务深度合成管理规定。

2023年7月,国家网信办联合国家发展改革委、教育部、科技部等7部门发布《生成式人工智能服务管理暂行办法》,对模型训练过程中可能涉及的数据歧视、知识产权保护、个人隐私及肖像权保护等作出明确规定,行业监管框架进一步完善。

放眼海外,美国国家标准与技术研究院于2023年1月发布了AI风险管理框架,着力为AI开发,治理,和运营提供风险控制最佳实践。欧盟则于2023年6月通过《人工智能法案》授权草案,对不同等级的人工智能所承担的责任和义务进行划分,通过风险定级来实现分层治理,并着力推动跨产业的人工智能立法,以进一步防范人工智能可能带来的多重风险。

结语

当下全球人工智能市场正处于高速增长阶段,本文从市场规模、技术栈、商业化应用和风险管理四大维度,对国内外GenAI行业的发展现状和趋势进行了深入浅出的分析。

尽管目前国内外市场在诸如大模型开发、应用布局、商业模式等多个领域都存在较大差异,我们看到中国GenAI行业正在不断追赶国际领先水平,预计未来中国GenAI相关技术和应用将逐渐成熟,并进一步探索出适合自身发展的商业模式。

四位作者介绍

曲向军,是麦肯锡全球资深董事合伙人,中国区金融机构咨询业务负责人,常驻香港分公司;

韩峰,是麦肯锡全球董事合伙人,常驻深圳分公司;

胡艺蓉,是麦肯锡全球副董事合伙人,常驻上海分公司;

王喆宸,是麦肯锡咨询顾问,常驻上海分公司。

相关推荐
拓端研究室1 小时前
【专题】2024年悦己生活消费洞察报告汇总PDF洞察(附原数据表)
人工智能
月眠老师1 小时前
拓展AI超级智能后的人类生活场景
人工智能·生活
是十一月末2 小时前
Opencv实现图片的边界填充和阈值处理
人工智能·python·opencv·计算机视觉
机智的叉烧2 小时前
前沿重器[57] | sigir24:大模型推荐系统的文本ID对齐学习
人工智能·学习·机器学习
凳子花❀2 小时前
强化学习与深度学习以及相关芯片之间的区别
人工智能·深度学习·神经网络·ai·强化学习
泰迪智能科技014 小时前
高校深度学习视觉应用平台产品介绍
人工智能·深度学习
盛派网络小助手5 小时前
微信 SDK 更新 Sample,NCF 文档和模板更新,更多更新日志,欢迎解锁
开发语言·人工智能·后端·架构·c#
Eric.Lee20215 小时前
Paddle OCR 中英文检测识别 - python 实现
人工智能·opencv·计算机视觉·ocr检测
cd_farsight5 小时前
nlp初学者怎么入门?需要学习哪些?
人工智能·自然语言处理
AI明说5 小时前
评估大语言模型在药物基因组学问答任务中的表现:PGxQA
人工智能·语言模型·自然语言处理·数智药师·数智药学