AI是什么 - 技术栈

了解AI，拥抱AI，理性看待AI

AI的全称是Artificial Intelligence，中文叫人工智能。简单来说，就是让机器像人一样思考。

现在的AI似乎是无所不能，即将颠覆一切。AI的能力究竟来自哪里，接下来简单说说AI的原理。

虽然AI的历史超过70年，仅讨论当前流行的AI大模型

说起AI的原理，总会出现一大堆复杂术语，但其核心原理并不复杂。先抛开复杂的术语，牺牲部分精准严谨，力求浅显易懂。

当前AI的核心能力就一个：对话补全能力，其它能力都是基于核心能力的衍生能力。

对话补全能力就是预测下一个词的能力，比如：用户输入123，AI预测下一个词是45的可能性比较大，就会补全成12345。当然实际上的原理和能力比较复杂，通过学习海量文本，来计算在特定上下文中最可能出现的下一个词是什么，从而生成连贯的句子和段落。

从这个原理可以推论出，输入的内容越多越详细，AI补全的内容也越精确越丰富。所以很多AI使用技巧都强调要详细准确描述需求，还可以先写一堆背景知识，让AI扮演某种角色或自己的身份背景介绍等等，让AI有足够多的内容去进行预测补全。

AI就像个算命先生，可以根据你提供的信息来展开各种话术。现阶段算命先生比AI更厉害，因为算命先生还会察颜观色，全方面的收集和了解信息，而AI仅能根据用户主动提供的信息来展开。

训练AI和小孩说话类似，先在小孩面前不断重复正确的语句，再让小孩模仿着学说话，小孩模仿正确时进行肯定，小孩模仿错误时进行纠正。

训练AI需要大量的语言材料（简称语料），比如：新闻、论文、产品说明书、小说、诗歌、数学题等都是语料，用海量的语料训练AI，这一步称为预训练，AI学会了语法、掌握了海量知识，甚至能预测下一句话是什么。

预训练结束后的AI，还不能直接拿来用。它虽然"博学"，但往往不懂礼貌、不会听指令，甚至会胡说八道（AI幻觉）。接下来的工作，就是要把AI调教成"懂事、听话、能干活"的助手。这个阶段通常被称为后训练或微调与对齐。

后训练有多种方式，常用的有：

用大量语料训练完毕的AI能够胜任文本生成、对话、翻译、代码编写、逻辑推理等与语言相关的任务。具体使用语料时，先将语料切割成词元（英文名：Token，可以简单理解为具有独立意义的词或字，词元也是AI工作量的计算单位）。训练后的AI就是用这些词元来回答用户提出的各种问题。

把词元的概念延伸到非语言方面，比如：图片切割的小块、小段音频、小段视频、现实中的各种物体特征等等，用这些非语言的词元形成的语料来训练AI，就可以得到各种各样的AI模型。

以AI图片生成模型为例，用大量视觉词元为语料来训练AI，训练后的AI就学会了用视觉词元来回答用户提出的图片要求，最后将回答的视觉词元还原成像素并形成图片（就像它生成文字一样，直接"写"出了图片）。

当前人工智能技术发展的核心脉络是："万物皆可词元化"。

简单来说，就是打破文字、图像、声音的界限，把它们都变成AI能理解的"通用积木"（即词元），然后用同一套逻辑去训练。AI的进化路径，就是把世界万物"翻译"成词元，然后用海量的算力去预测这些词元的排列组合规律。