了解AI,拥抱AI,理性看待AI
AI的全称是Artificial Intelligence,中文叫人工智能。简单来说,就是让机器像人一样思考。
AI能做什么
- 智能助手:你对手机说"回家",导航就能规划路线;或者使用手机上各种语音助手。
- 内容推荐:刷短视频或购物时,总能看到你感兴趣的内容,背后就是AI推荐算法在工作。
- 内容创作:AI可以帮你写文章、写代码、翻译语言,甚至根据文字描述生成精美的图片和视频。
- 医疗健康:AI可以辅助医生分析X光片、CT影像,帮助识别病变,提高诊断效率和准确率。
- 自动驾驶:汽车利用AI技术识别道路、行人和交通标志,实现辅助驾驶甚至无人驾驶。
- 智能制造:AI智能排产、AI视觉质检、设备预测性维护、一线工人AI助手。
现在的AI似乎是无所不能,即将颠覆一切。AI的能力究竟来自哪里,接下来简单说说AI的原理。
AI的原理
虽然AI的历史超过70年,仅讨论当前流行的AI大模型
说起AI的原理,总会出现一大堆复杂术语,但其核心原理并不复杂。先抛开复杂的术语,牺牲部分精准严谨,力求浅显易懂。
当前AI的核心能力就一个:对话补全能力,其它能力都是基于核心能力的衍生能力。
对话补全能力就是预测下一个词的能力,比如:用户输入123,AI预测下一个词是45的可能性比较大,就会补全成12345。当然实际上的原理和能力比较复杂,通过学习海量文本,来计算在特定上下文中最可能出现的下一个词是什么,从而生成连贯的句子和段落。
从这个原理可以推论出,输入的内容越多越详细,AI补全的内容也越精确越丰富。所以很多AI使用技巧都强调要详细准确描述需求,还可以先写一堆背景知识,让AI扮演某种角色或自己的身份背景介绍等等,让AI有足够多的内容去进行预测补全。
AI就像个算命先生,可以根据你提供的信息来展开各种话术。现阶段算命先生比AI更厉害,因为算命先生还会察颜观色,全方面的收集和了解信息,而AI仅能根据用户主动提供的信息来展开。
AI是如何具有对话补全能力的?
训练AI和小孩说话类似,先在小孩面前不断重复正确的语句,再让小孩模仿着学说话,小孩模仿正确时进行肯定,小孩模仿错误时进行纠正。
训练AI需要大量的语言材料(简称语料),比如:新闻、论文、产品说明书、小说、诗歌、数学题等都是语料,用海量的语料训练AI,这一步称为预训练,AI学会了语法、掌握了海量知识,甚至能预测下一句话是什么。
预训练结束后的AI,还不能直接拿来用。它虽然"博学",但往往不懂礼貌、不会听指令,甚至会胡说八道(AI幻觉)。接下来的工作,就是要把AI调教成"懂事、听话、能干活"的助手。这个阶段通常被称为后训练或微调与对齐。
后训练有多种方式,常用的有:
-
问答示范(术语:监督微调)
准备大量的"指令-回答",让AI明白遇到这样的问题应该如何回答。
-
评价(术语:强化学习)
问AI问题,让AI给出几个不同的回答,然后由人对这些回答进行打分,让AI学会人类的价值观。
-
学专业知识(术语:领域适配)
比如希望AI成为医生,就用大量的医学相关的语料训练AI,让AI掌握这些专业知识。
AI的衍生能力
用大量语料训练完毕的AI能够胜任文本生成、对话、翻译、代码编写、逻辑推理等与语言相关的任务。具体使用语料时,先将语料切割成词元(英文名:Token,可以简单理解为具有独立意义的词或字,词元也是AI工作量的计算单位)。训练后的AI就是用这些词元来回答用户提出的各种问题。
把词元的概念延伸到非语言方面,比如:图片切割的小块、小段音频、小段视频、现实中的各种物体特征等等,用这些非语言的词元形成的语料来训练AI,就可以得到各种各样的AI模型。
以AI图片生成模型为例,用大量视觉词元为语料来训练AI,训练后的AI就学会了用视觉词元来回答用户提出的图片要求,最后将回答的视觉词元还原成像素并形成图片(就像它生成文字一样,直接"写"出了图片)。
AI前景展望
当前人工智能技术发展的核心脉络是:"万物皆可词元化"。
简单来说,就是打破文字、图像、声音的界限,把它们都变成AI能理解的"通用积木"(即词元),然后用同一套逻辑去训练。AI的进化路径,就是把世界万物"翻译"成词元,然后用海量的算力去预测这些词元的排列组合规律。