以ChatGPT为首的AIGC软件出现至今,不过短短半年时间,已经从方方面面浸入到人们的生活里,与此同时,大量专业术语涌入我们视野。
AI、AIGC、AGI、Bing AI,ChatGPT......这些字母缩写到底是什么?有什么区别?
本文将尽可能用最直白通俗的语言,帮你搞清楚常见的AI术语。
一、AIGC发展历程
既然要了解AIGC,首先让我们一起来回顾AIGC发展历程吧。
AIGC发展可分为三阶段,早期萌芽阶段(上世纪50年代至90年代中期),沉淀累积阶段(上世纪90年代至本世纪10年代中期),快速发展阶段 (本世纪10年代中期至今)。
早期萌芽阶段(1950s-1990s)
由于技术限制AIGC仅限于小范围实验与应用,1957年出现首支电脑创作的音乐作品,弦乐四重奏《依利亚克组曲(Illiac Suite)》,80年代末至90年代中由于高成本及难以商业化,因此资本投入有限导致AIGC无较多较大成绩。
沉淀累积阶段(1990s-2010s)
AIGC从实验性转向实用性,2006年深度学习算法取得进展,同时GPU,CPU等算力设备日益精进,互联网快速发展,为各类人工智能算法提供海量数据进行训练。2007年首部人工智能装置完成的小说《I The Road》(《在路上》)问世,2012年微软展示全自动同声传译系统,主要基于"深度神经网络"(Deep Neural Network,DNN)自动将英文讲话内容通过语音识别等技术生成中文。
快速发展阶段(2010s至今)
2014年深度学习算法"生成式对抗网络"(Generative Adversarial Network, GAN)推出并迭代更新,助力AIGC新发展。2017年微软人工智能少年"小冰"推出世界首部由人工智能写作的诗集《阳光失了玻璃窗》,2018年NVIDIA(英伟达)发布StyleGAN模型可自动生成图片,2019年DeepMind发布DVD-GAN模型可生成连续视频。2021年Open AI推出DALL-E并更新迭代版本DALL-E-2,主要用于文本、图像的交互生成内容。我国AIGC市场在2022年底引起较大关注,2023年开年企业端跃跃欲试。虽然行业仍处于起步阶段,距离大规模证明和体系化发展仍有距离,但从资本的加码到应用场景的探索,距离的缝隙有望逐步填补,同时,"模块分拆+个性化推荐"的"泛AIGC"形式有望持续发展。
二、人工智能技术变革
AIGC是一种人工智能技术。
人工智能的发展经历几次大的技术变革,总结起来主要有三个范式:逻辑学、概率论、深度学习。
逻辑学
由逻辑规则构建的专家系统,这时候AI就像一位经验丰富的'老专家',能基于以往的经验提供解决方案。
这种模式带来的问题,是专家知识和经验总会有局限性,因此AI所能处理的问题也存在边界。
专家系统被广泛应用在不同的领域,例如在工业领域实现生产质量监控,生产过程控制等;在金融领域实现风险评估、投资决策等。
概率论(机器学习)
由数据统计构建的概率系统,这时候AI就像一位能通灵的'算命先生',能基于概率分布提供决策辅助。
例如以贝叶斯网络,隐马尔可夫模型等为代表的概率统计算法逐步被应用后,形成ASR(语音识别)、NLP(自然语言处理)、CV(计算机视觉)、垃圾邮件监测、信用评估等领域。
深度学习
由神经网络构建的决策系统,这时候AI就像一位有学问的'智者',能通过数据特征形成精准决策。
例如以小样本学习、强化学习、迁移学习为代表的深度学习框架已经成为移动应用的支撑。包括游戏AI、自动驾驶、智能推荐、内容生成、人脸识别等领域。
早期的逻辑控制、概率统计,包括深度学习主要以感知和理解世界,为人类提供决策辅助为主,因此也被称为'决策式智能'。
'决策式智能'的目标相对聚焦,主要通过特征抽象和映射关系解决单场景决策问题。例如过去AI下围棋、识别人脸都是决策式智能的应用范畴。
随着深度学习的广泛应用,逐步衍生出一种新的技术范式'生成式智能'。'生成式智能'主要以知识构建和推理演绎,为人类提供创造力支撑为主。
'生成式智能'的目标更加泛化,主要通过推理能力和思维链的构建,解决跨域多场景问题。例如ChatGPT知识问答、代码生成,DALL-E的图片生成都属于生成式智能的应用范畴。
三、AI 工作原理
AI,全称Artificial Intelligence,人工智能。顾名思义,让机器发展出像人一样的智能,可以看到、听到、思考、判断,然后根据经验作出决策。
而AI之所以能够走向现实生活,影响到多个行业领域的生产工作,离不开三个重要技术的支撑:深度学习、神经网络以及生成式对抗网(GAN)。
神经网络
神经网络是一种模拟人脑神经元连接的算法模型。你可以把神经网络想象成一个大脑。 就像大脑由许多神经元相互连接构成,神经网络也由许多"节点"或"神经元"通过"链接"相互连接。这些链接就像我们大脑中的神经连接,可以传递和处理信息。
深度学习
如果说神经网络像一个普通大脑,深度学习则是一个更加"聪明"的大脑。 在这个"大脑"里,神经元被组织成许多层,这就像大脑的不同区域处理不同的任务一样。每一层都在学习和处理数据的不同特征或部分。这就使得深度学习能够处理非常复杂的问题,比如识别图像或理解自然语言。
生成式对抗网络(GAN)
GAN技术可以说是推动这次AIGC热潮的关键技术,有了它,AI才能够生成逼真的图像、音频和文本。 你可以把GAN的工作原理想象成是一个艺术家和艺术评论家的竞赛。艺术家(生成器)的工作是创造看起来真实的艺术作品,而艺术评论家(判别器)的任务是判断这个作品是否真的来自真正的艺术家,还是来自我们的AI艺术家。艺术家(生成器)开始时可能不太擅长制作逼真的作品,而评论家(判别器)也可能并不擅长识别真伪。但是,随着他们不断的竞争,艺术家的作品变得越来越逼真,评论家的判断能力也越来越强。
在这个不断生成和对抗的过程中,AI逐渐学会了如何创作看起来非常真实的作品。
四、AI大模型/预训练大模型
AI大模型是一种机器学习模型。它可以学习和处理更多的信息,比如图像、文字、声音等,也可以通过训练,完成各种复杂的任务。比如智能语音助手和图像识别软件都会用到AI大模型。
这里的「预训练」,可以理解为像学生学习知识一样,机器也需要通过学习和训练来获取相关的知识和技能,来完成各种任务。AI预训练大模型可以通过不同领域的大量训练,掌握知识和技能。 由OpenAI公司开发的模型GPT就是一种大型语言模型,** 也是预训练模型的一种,它能够自动生成各类文本,比如新闻报道、小说,也可以回答问题、写文章、进行对话。GPT是目前自然语言处理领域最为先进的自然语言生成模型之一。地方
五、自然语言处理(NLP)
自然语言处理(NLP)就像是教计算机理解和使用人类语言的一种技术。举个例子,当你对手机说:"打开天气应用,查看明天的天气。"这就涉及到了自然语言处理。你的手机需要理解你的指令------这是什么意思,你想做什么,然后才能执行正确的动作。
自然语言处理需要用到很多开源的工具和软件,它们能够帮助研究员处理语言数据,大大降低开发的门槛,让自然语言处理技术的进步的速度变快。
六 、AIGC
是指由AI自动创作生成的内容( AI Generated Content),即AI接收到人下达的任务指令,通过处理人的自然语言,自动生成图片、视频、音频等。
打个通俗点的比方,AIGC就像一支马良神笔,拥有的无尽创造力。这支笔的特别之处在于,是由AI打造的。来自AI的理解力、想象力和创作力的加持,它可以根据指定的需求和样式,创作出各种内容:文章、短篇小说、报告、音乐、图像,甚至是视频。AIGC的出现,就像是打开了一个全新的创作世界,为人们提供了无尽的可能性。从用户生成内容(UGC),到专业生成内容(PGC),再到现在的人工智能生成内容(AIGC),我们看到了内容创作方式的巨大变革和进步。
七、AI到AGI时代变革
八、AIGC和Chat GPT的关系
AIGC是AI大模型,特别是自然语言处理模型的一种重要应用;ChatGPT则是AIGC在聊天对话场景的一个具体应用。
可以把AIGC看作是一个大的范畴,而ChatGPT是其中一个类别的小应用。
九、 AIGC的四大产品形态
基于三大底层元能力,未来的大模型应用将沿着 AIGC(内容生成)、Copilot(智能助手)、Insight(知识洞察)、Agent(数字代理)四个重要方向演进:
1) AIGC(内容生成):内容生成是生成式 AI 创造力得以展现的核心,包括文本、图像、视频、代码、3D 模型等。
其中文本生成已经广泛应用于教育、法律以及对话业务中;图像和视频生成和3D则被营销、影视创作、游戏等领域所应用。
2)Insight(知识洞察):生成式AI可以有效解决决策式AI数据样本稀疏的问题,基于大模型实现对数据、信息、知识进行充分整合,为用户提供精准的研究分析和辅助决策。
知识洞察将应用于制造、教育、金融、医疗、军事等领域。例如AI协助医生针对特定病灶进行洞察分析、针对诊断方案进行辅助决策。
3)Copilot(智能助手):Copilot是生成式AI应用最广泛的产品形态,主要是将AI能力嵌入具体应用场景中,让AI像小助手一样,主动理解用户意图并提供成型的方案。
例如微软的Office 365 Copilot系列,可以支持word文本内容生成,excel可视化图表,包括ppt智能排版,邮件自动回复等。
4) Agent(数字代理):相较于Copilot的工具型辅助能力,Agent更强调对环境的实时感知和判断能力,AI能像人类一样形成自己的独立决策及行动方案。
此外Agent更关注AI的独立性和场景泛化,能培养自适应学习能力和持续进化能力,目前主要应用在智能终端、智能座舱、汽车自动驾驶、工业机器人、人形机器人等领域。
了解了这些关键词,相信大家已经有了一定了解。
十、最后,总结一下
1) 我们要拥有快速学习的能力
我在一线在产业界和学术界中很大的感触,就是技术革命的节奏越来越快。这就告诫我们必须培养快速学习这一核心能力,否则就会跟不上时代的变化。
2)学会适应
我们需要适应AI的辅助,利用AI来增强自己,把它真正作为一个工具。
总的来说,快速学习的能力、创新能力和驾驭使用AI工具的能力,这三项能力是我认为需要增强的。
对于大数据开发来说,掌握AIGC系统框架