2023年的AIGC行业总结

本文基于艾瑞《2023年中国AIGC产业全景报告》整理。

AIGC产业的市场规模

根据第50次《中国互联网络发展状况统计报告》,截至2022年6月,中国互联网普及率已高达74.4%。在网民规模持续提升、网络接入环境日益多元、企业数字化进程不断加速的宏观环境下,AIGC技术作为新型内容生产方式,有望渗透人类生产生活,为千行百业带来颠覆变革,开辟人类生产交互新纪元。艾瑞咨询预测,2023年中国AIGC产业规模约为143亿元,随后进入大模型生态培育期,持续打造与完善底层算力基建、大模型商店平台等新型基础设施,以此孕育成熟技术与产品形态的对外输出。

2028年,中国AIGC产业规模预计将达到7202亿元,中国AIGC产业生态日益稳固,完成重点领域、关键场景的技术价值兑现,逐步建立完善模型即服务产业生态,2030年中国AIGC产业规模有望突破万亿元,达到11441亿元。

AIGC行业的PEST分析

政策(Politics)

目前国家对于AIGC产业的政策,以完善算力与数据等要素供给为基础,以模型算法创新为关键,以场景应用为牵引,构建活跃的AIGC创新与应用生态。

分区域来看,以北京为代表的AIGC创新及产业要素聚集地在政策层面支持力度更大。合 规监管政策方面,《生成式人工智能服务管理暂行办法》奠定了我国对于AIGC包容审慎、分级分类监管的主基调,明确生成式人工智能服务提供者应承担网络信息安全、个人信息保护等义务,提出需进行安全评估与备案、对生成内容进行标识等服务规范。

经济(Economy)

2021年至2023年7月期间AIGC赛道共发生280笔投融资,展现了其高热度与高成长性。从产业细分维度,应用层创业机会最多,模型层创业受到ChatGPT影响,在2023年集中涌现;在获投的应用与模型层创业项目中,文本、影像、语音平分秋色,但相比单一模态,多模态和跨模态的应用前景更加为资本所看好。

从投融资轮次维度,70%左右的项目仍处于A轮及以前阶段,同时有高达14.6%的比例属于股权、战略融资,说明赛道虽然处于起步期,但其战略价值已被公认。在全部获投的170家公司中,获投3次及以上公司约占17%。同一标的的高频融资,从企业需求侧反应AIGC前期创业所需大量资金支持,从资方供给侧表明优质创业项目仍非常稀缺。

社会(Society)

受惠于各行业不断丰富的数据资源、算力硬件资源的持续发展以及大模型技术的突破性发展,AIGC得以更好的抽象来自于真实世界的多模态数据源并进行有效表达,展现出其作为内容生产的通用工具在各行各业大规模应用的巨大潜力。

放眼未来,随着实体经济中更多领域加速数字化进程,实体经济体系将进一步完成数字化效率变革。作为现阶段AI产业的排头兵,AIGC对生产力的革新,将一定程度引领产业涌进从IT化、互联网化到智能化的第三阶段数实融合浪潮。

技术(Technology)

AIGC技术可按照模态分为文本、图像、语音以及多模态等。音频生成技术成熟度最高,其余各模态技术发展稍缓,核心算法仍存在大面积黑箱,虽然在生成效果上整体能够达到人类平均水平,部分场景达到人类优秀水平,但在算力成本、生成稳定性、个性化精细化需求满足等方面存在明显瓶颈。

大部分AI生成图像目前无法支持画师对细节进行精细化的修改,文本生成内容仍会出现事实性错误,因而目前无法达到大规模成熟应用水平。

从技术迭代速度看,各模态呈现出成熟度越低,迭代速度越快的特点,文本和图像生成领域几乎每1-2个月就能出现突破性技术进展,未来可期。

AIGC产业图谱

  • 应用层:To C应用试水,合规性与付费意愿等要素限制有规模化难度;To B应用将在数字化基础做进一步渗透扩张,场景边界仍在探寻。
  • 模型层:MaaS是大模型能力落地输出的新业态,模型层将更贴近应用侧,工具链完完善度影响用户体验,进一步催生工具层发展。
  • 工具层:AI Agent与大模型服务/平台是AIGC时代下新衍生的工具层,已成为继大模型之后,更有想象空间却也更贴近应用的下一爆点。
  • 算力层:带动算力基础设施建设,大模型运行对其提出更高要求。

大模型层面

多模态成为趋势

预训练大模型按照模态可以分为文本、图像、视频、代码、音乐生成等多种,但从底层架构上都分属两类。Transformer是一种编解码模型框架,适用于处理文本、代码这类强连续性生成任Diffusion、GAN、NeRF等框架善于处理图像生成类任务。叠加文图转换技术可以形成文生图模型。由单模态模型在实际训练时融合其他模态技术,可形成多模态、跨模态大模型,如GPT-4、文心一言、 Mid journey等,由于多模态模型可接受文本、图像等不同输入输出形式,对应用场景能够更广泛适配,着力发展多模态模型成为产研两界共同趋势。

NLP是重点活跃领域

从全球范围来看,中美两国在大模型领域都取得了令人瞩目的成果。2019年,美国率先在大模型领域取得突破性进展,推出了BERT、GPT等具有里程碑意义的预训练模型。2020年,ERNIE系列模型和TinyBERT等轻量化模型的推出拉开了中国大模型产业快速发展的序幕。

2021年以来,中美在大模型领域逐渐呈现出分庭抗礼的趋势,共同引领全球大模型产业的发展;聚焦国内,从技术领域来看,国产大模型广泛的覆盖了自然语言处理、多模态、机器视觉等多个技术分支,形成了紧跟世界前沿的大模型技术群。其中,自然语言处理是目前国内大模型最为活跃的技术领域,超六成的国产大模型主要基于自然语言处理技术进行预训练和微调;多模态领域活跃度仅次于自然语言处理技术,超两成的国产大模型可处理图像、视频、音频等多模态数据;而聚焦在计算机视觉和智能语音等领域的国产大模型数量相对较少。从研发主体来看,国内企业、高校、科研机构等不同创新主体均积极参与大模型研发。其中,企业仍是国内大模型研发的主力军,约46%的大模型由企业独立研发;高校及科研机构也对大模型的研发做出较大贡献,约37%的大模型由高校/科研机构独立研发。同时,我们也观察到目前由企业与高校/科研机构联合研发的大模型尚不足20%,展现出大模型开发在产学研合作方面仍有较大潜力。

开源+闭源共存

2023中关村论坛上,科技部副部长吴朝晖表示,中国将坚持开源协作,加强大模型技术持续创新,协同解决透明性、稳定性等共性问题,进一步推动算力资源和数字资源开放共享,加快形成大模型的产业生态。而AIGC开源社区的建设可以吸纳更多的开发者及拥有定义用户的主导权,以AI开源创新平台为杠杆,带动支撑底层AI芯片、智算中心及云服务等基础设施发展。从供给侧逻辑来看,大模型开源早期由高校和机构推动,如清华大学的ChatGLM-6B、复旦大学的MOSS,陆续有头部云厂商加入,如百度的文心系列与阿里的通义系列,共同为中国AIGC开源社区的建设"增砖添瓦",以阿里云魔塔社区、百度云飞桨社区为代表的开源社区建设成果初现,而千亿级模型暂以闭源路径开展,凭借稳定、优质效、完整工具链等产品特点定位应用市场;从商业化路径来看,参考海外明星开源社区Hugging Face的商业模式,中国AI开源社区同样会先免费提供基础算力,为客户提供免费的社区体验、demo部署及测试,并进一步通过付费服务推送轻量级迁移的微调推理服务或深度开发的训练调优平台,提升模型产品性能,通过开源社区吸引开发者、企业客户完成更多部署应用资源的引流变现。

Maas打造大模型生态

MaaS(Model-as-a-Service),模型即服务,是指以云计算为基础,将大模型作为一项服务提供给用户使用的新业态。如今,MaaS模式已成为各家云巨头厂商发展第一战略优先级,把模型作为重要的生产元素,依托于既有IaaS设施与PaaS平台架构,为下游客户提供以大模型为核心的数据处理、特征工程、模型训练、模型调优、推理部署等服务。

未来,顺应大模型开源趋势,MaaS服务商将着力打造大模型商店平台,发力大模型生态建设,纳入更多允许商用的开源模型,提升平台的基模类型及能力,并丰富工具链产品服务,通过业务积累、数据回流、模型迭代逐步形成壁垒,在拉高云服务营收天花板的同时进一步塑造厂商的核心竞争力。

Agent具有更广阔的角色价值

早在20世纪80年代,计算机科学家已着手探索开发一个能与人类交互的智能软件,类似于AI Agent的雏形应用一直在被构思讨论。当下大模型的涌现能力成功赋予AI Agent更多想象与落地空间。一方面,大模型的语料资源包含了大量的人类行为数据,填补了AI Agent可行性与合理性的关键要素。另一方面,大模型涌现出优秀的上下文学习能力、复杂推理能力,在接受目标及设定后,可自发性将其拆解成简单细化的子任务,无需人类干预去完成剩下的全部工作,如Sweep完成全项目的自动"清扫"bug报告和功能请求、Cheat Layer实现对全网页操作的自动化、GPT Researcher完成任意主题的综合研究呈现等,浅层代替传统的RPA及人类重复性工作,深层化身为人类在各行各业的操作助手。目前AI Agent已成为继大模型之后,更有想象空间却也更贴近应用的下一爆点。

海外亚马逊、OpenAI及国内高校、云巨头厂商都热情满满,陆续发布AI Agent的学术研究成果及产品应用。未来,人与AI的协作交流或进一步由Agents作为智能媒介实现,每个人都可以使用各类AI-Agent完成现实任务的处理执行,人类由此进入庞大复杂的AI智能体文明。而要想实现这些,将宝贵的垂类数据与业务理解集成到Agent框架之中,保证大模型应用在执行任务时可以访问到正确的信息并高效执行产出,是未来AI Agents能发挥出实际效用的关键。相较于模型层,AI Agents将留给创业者更多机会。

应用层面

产业化价值-内容生产/人机交互

总体来看,大模型基于其在内容生成、总结、逻辑推理等方面的能力,已在多种AI服务的技术开发环节中展开融合替代。其中,内容生成与理解是大模型的核心能力,AIGC的产业价值主要体现在以此为核心的"变革内容生产方式"与"变革人机交互方式"两方面。

大模型对内容理解和内容生成的双向能力使其既能以极低门槛实现多模态内容生成,也可脱离内容生产核心场景泛化为一种人机对话的媒介。未来,全行业将借助大模型能力衍生出的大量AI生产工具,实现内容生产效率的飞跃,并进一步降低数字生态的人机交互门槛。

AIGC与元宇宙的交融

从商业叙事与应用场景来看,元宇宙与AIGC的共同之处颇多。首先在赛道范围上,AIGC主打数字原生,而元宇宙则在数字原生之外额外包含数字孪生部分;其次在赛道价值上,元宇宙是讲述脱实向虚开创第二增长曲线的故事,而AIGC不仅着力于数字世界的创建,更能影响及改造现实世界。 从市场发展看,近年来元宇宙赛道因技术能力难以支撑商业化愿景而在资本侧与用户侧遇冷,而AIGC应用将改善市场对元宇宙的预期。在数字原生领域,AIGC能通过高质量创作工具,提升UGC创作能力和热情;而在数字孪生领域,AIGC能够逐渐帮助实现自动设计、渲染等,提升孪生模型生产效率和质量。

ToC赛道-内容消费赛道

内容分发平台一端链接创作者,一端绑定大量用户,拥有最为完整的内容消费生态,也天然成为了AIGC内容消费的布局核心。原本,内容消费市场按照创作者和商业模式可大致分为PGC和UGC。PGC专业性强,以内容付费为主要盈利模式,需要快速大量推出新内容刺激用户购买,因此PGC平台的主要战略是前向打通内容制作环节,并为了提高用户粘性同步发展UGC;UGC内容相对生活化,本质是贩卖流量,需要将内容质量保持在可持续吸引用户注意力的水平。

因此,两类平台均在积极布局面向UGC的AI创作工具。由于线上社交需求持续增长,社交业务也展现出超强的盈利能力,是内容分发平台变现的新方向,如网易云音乐2022年在社交娱乐板块收入已大大超出其音乐服务收入。各大内容平台也都在布局社群业务,盘活手中用户,其中应用到AIGC技术支撑的营销文案、电商图片甚至评论的自动生成中。

To B赛道-企业服务赛道

AIGC在企业服务赛道中具有广泛的应用前景。通过其强大的语义理解和生成能力,AIGC可以为企业提供多种解决方案,从供应链管理到智能客服,为企业提高工作效率、优化决策,并提供个性化的客户服务体验。

在供应链管理方面,AIGC可以通过分析大量的数据和信息,提供准确的预测和决策支持。它可以帮助企业优化物流运营,提高供应链的可靠性和效率。通过深入理解供应链中的各个环节和因素,AIGC可以识别潜在的风险和瓶颈,并提供相应的解决方案。此外,AIGC还可以根据市场需求和供应链变化,自动调整生产计划和库存管理,以确保供应链的灵活性和适应性。

在智能客服领域,AIGC可以通过自然语言处理和文本生成技术,提供智能化的客户服务。它可以理解客户的问题和需求,并提供准确的回答和解决方案。无论是在线聊天机器人还是语音助手,AIGC都可以提供高效、个性化的客户支持。它可以处理大量的客户咨询和请求,并根据客户的个性化需求进行定制化的回应。通过与AIGC的交互,客户可以得到快速、准确和满意的解答,提升客户满意度和忠诚度。

除了供应链管理和智能客服,AIGC还可以在企业的决策过程中发挥重要作用。通过对大量的数据进行分析和挖掘,AIGC可以帮助企业发现隐藏的模式和关联,提供全面的市场洞察和业务预测。它可以为企业提供实时的竞争情报和趋势分析,帮助企业做出更明智的决策。无论是市场营销策略的制定还是产品研发的规划,AIGC都可以提供有价值的信息和建议,为企业的发展提供有力支持。

算力层面

算力需求承受一定的压力

自2017年谷歌提出Transformer架构后,人工智能发展逐步迈入预训练大模型时代。2018年6月,OpenAI的GPT模型参数量已经达到1.17亿,模型参数量开始实现亿级基底的飞越发展,平均每3-4个月即呈现翻倍态势,由此带来训练算力需求也"水涨船高"。算力正在成为影响国家综合实力和经济发展的关键性要素。浪潮信息发布的相关报告表明,计算力指数平均每提高1个点,数字经济和 GDP将分别增长千分之3.3和千分之1.8。

面对算力层的供需结构矛盾,各国积极发展算力层基础设施建设。在计算力指数国家排名中,美国坐拥全球最多超大规模数据中心,以75分位列国家计算力指数排名第一,中国获得66分位列第二,随后为日本、德国、英国等国,算力建设已然成为国家高质量发展的战略级方针。2022年末,在OpenAI的GPT模型涌现能力后,AI产业迅速进入以大模型为技术支撑的AIGC时代,巨量训推算力需求让本就供需不平的算力产业结构进一步承压。目前中国各地正加快新一批数据中心与智算建设,持续优化算力资源,满足未来高速发展的大算力需求。

英伟达All in AI

受益于AIGC爆发,英伟达再度股价飞升,如今英伟达估值已达到1万亿美元,成功进入苹果、微软、谷歌、亚马逊所在的"万亿俱乐部",成为美股有史以来首个市值触达1万亿美元的芯片公司。2023年3月,英伟达举办GTC(GPU Technology Conference)大会,介绍推出基于Hopper架构打造的产品H100、为AI生成视频提供硬件支持的L4图形GPU、融合了Grace架构CPU与Hopper架构GPU的GH200等重磅产品。

此外,英伟达更是将产品布局延伸到上游,推出历时四年的cuLitho光刻库,与台积电、ASML和 Synopsys等上游厂商合作,将计算光刻加速了40倍以上;并积极拓展下游模型应用场景,推出一系列围绕生成式AI发布的系列加速模型训练和推理软硬件产品及服务。8月,英伟达在计算机图形年会SIGGRAPH上宣布全球首发HBM3e内存------推出下一代GH200Grace Hopper超级芯片,并宣布与Hugging face建立合作伙伴关系,助攻生成式AI模型的高效开发与部署。

总结来看,英伟达早期以软硬产品结合策略构筑起AI芯片龙头地位,当下顺着生成式AI浪潮,英伟达已进一步开拓上下游布局,意图构建一套围绕产业上下游运转的应用开发生态,进一步加深公司技术与生态的护城河。

国产芯片尚未进入成熟期

作为AIGC产业的基建层,算力是AIGC生产力卡脖子的关键环节。对此,算力生产商纷纷发力,如AMD、英特尔等追赶型企业针对AIGC的产品新品动作频频。对标英伟达的Grace Hopper,AMD推出"CPU+GPU"双架构的Instinct MI 300进军AI训练端。英特尔即将在2025年发布Falcon Shores GPU,将其混合架构改为纯GPU解决方案。全球掀起一阵GPU采购热潮,马斯克抢购一万张卡加入AIGC大战,而国内厂商除过往存货外,受中美禁令限制仅能采购英伟达H版GPU,在算力及带宽方面受到极大限制。

目前,国内大模型训练芯片仍以英伟达GPU为主,且英伟达作为首批训推部署框架成品及平台生态将进一步巩固其在生成式AI的优势地位,但国内客户正积极与海内外追赶型企业如AMD接触,意图打破英伟达的溢价与垄断体系。自2018年以来,美国陆续对中国企业实行贸易管制,进入到美方黑名单上的中国企业已达到了千余家,尤其在半导体、人工智能等先进科技领域,国产芯片实现自主创新迫在眉睫,中国科技部也陆续出台政策推动人工智能公共算力平台建设。目前国产芯片虽在成片进度有所突破,但整体还尚未进入成熟期。以适配AIGC大模型训练角度出发,国产产品会出现宕机、兼容性差、AI框架支持度低及核心IP受限等过渡性问题。在AIGC浪潮下,AI芯片发展路径更加聚焦于AISC品类,中国算力层也会进一步尝试脱离对头部厂商英伟达的依赖,以"云巨头自研自用+独立/创业公司服务于信创、运营商等To G与To B市场"为两条主线发展路径,静待国产替代曙光,实现国产"算力+应用"的正循环。

总结

  • 在未来,随着大模型的发展和应用,AI Agent将扮演更广泛的角色,成为人类在各行各业中的操作助手和智能媒介。
  • AIGC与元宇宙有许多共同点,两者都在数字原生领域发挥着重要作用,而AIGC的应用将改善市场对元宇宙的预期。
  • 在应用层面,AIGC在内容生产、人机交互、内容消费和企业服务等领域具有广泛的应用前景。
  • 在算力层面,AIGC的发展对算力的需求提出了一定的压力,英伟达以及其他算力供应商纷纷发力以满足需求,而国产芯片尚未进入成熟期。
  • 总体而言,AIGC是一个充满潜力的领域,期待2024年能够有更多的发展。
相关推荐
东胜物联6 分钟前
探寻5G工业网关市场,5G工业网关品牌解析
人工智能·嵌入式硬件·5g
皓74117 分钟前
服饰电商行业知识管理的创新实践与知识中台的重要性
大数据·人工智能·科技·数据分析·零售
985小水博一枚呀1 小时前
【深度学习滑坡制图|论文解读3】基于融合CNN-Transformer网络和深度迁移学习的遥感影像滑坡制图方法
人工智能·深度学习·神经网络·cnn·transformer
AltmanChan1 小时前
大语言模型安全威胁
人工智能·安全·语言模型
985小水博一枚呀1 小时前
【深度学习滑坡制图|论文解读2】基于融合CNN-Transformer网络和深度迁移学习的遥感影像滑坡制图方法
人工智能·深度学习·神经网络·cnn·transformer·迁移学习
数据与后端架构提升之路1 小时前
从神经元到神经网络:深度学习的进化之旅
人工智能·神经网络·学习
爱技术的小伙子1 小时前
【ChatGPT】如何通过逐步提示提高ChatGPT的细节描写
人工智能·chatgpt
深度学习实战训练营3 小时前
基于CNN-RNN的影像报告生成
人工智能·深度学习
昨日之日20064 小时前
Moonshine - 新型开源ASR(语音识别)模型,体积小,速度快,比OpenAI Whisper快五倍 本地一键整合包下载
人工智能·whisper·语音识别
浮生如梦_5 小时前
Halcon基于laws纹理特征的SVM分类
图像处理·人工智能·算法·支持向量机·计算机视觉·分类·视觉检测