【人工智能】AI的三层金字塔逻辑

AI的三层金字塔逻辑

【人工智能】AI的三层金字塔逻辑
- 第一层：核心大脑
- 第二层：感官与四肢
- 第三层：骨骼与工具
- - 1）解决AI知识局限
  - 2）解决被动回答的问题
- [四. 总结](#四. 总结)

第一层：核心大脑

就是所说的LLM大语言模型。市面上所说的大语言模型，他们最为核心的功能是处理文字以及逻辑思考。我们可以把他理解为一位上知天文下知地理的全能型教授。他很强很全面但是他也有知识盲区，它是一个不认识你的聊天机器人。

1）优点：全面知识快速答复

它的记忆非常的好，你问他各种问题也能很快的给与答复。我们可以把他当做智商极高，在各个领域都十分精通的陌生人。

2）缺点：时间范围局限

知识有局限性，大模型的数据的局限一个是时间节点。比如上个月发布的大模型无法获取本月发生的事情，训练大模型这个动作一定是在上个月之前进行的，它没有获取未来数据的能力。大模型也不可能知道每家企业的企业数据，也不可能知道每个人的个人偏好及隐私，所以说他的知识范围是受到限制的。

3）缺点：不会主动思考

你问大模型问题之后，它才会回答你的问题，如果你不问他，它不会给你答复。他是只有在你提问之后才会去转的超级大脑。

4）如何填补缺点

这里就需要提到提示词的运用以及前置条件与需求的详细说明。越具体越好，需要能把问题描述清楚，不要让AI来猜你。

向一位不认识不了解你的天才教授咨询，你需要跟他先说明清楚：你是谁，你的性能，你的职业，你的经历，你的需求。

第二层：感官与四肢

我就也称其为多模态模型。我们可以把它理解为AI的手脚，眼睛以及耳朵。如果大语言模型是一个全能型的教授，他只能输出文字的话，那么生图生成视频，生成音乐等这些AI就是给了这位教授一双画家的手，导演的眼睛和歌手的嗓子。这个我们就称作多模型能力。

多模态只是给了AI或者说给了天才教授感官与四肢，但教授的两个局限还是存在：一个是知识又局限性另一个是不会主动思考，于是我们就需要用到第三层的工具。

第三层：骨骼与工具

它又可以分为两个部分：一个是联网知识库和工作流智能体。

1）解决AI知识局限

相当于我们给天才教授配备了联网工具，让天才教授通过搜索获得最新的知识和新闻。其次再给天才教授配上知识库，相当于把你锁在抽屉中的私人日记（比如内部代码文档或者合同等）交给他之后再问他问题，这个时候AI就会基于你提供的真是信息来回答现在的问题，就不会出现胡编乱造的情况了（知识局限的问题在这里解决了）。

2）解决被动回答的问题

但是现在的天才教授任然像一个NPC一样非常的被动的聊天机器（不是能和你主动聊天的数字员工）。这个时候就需要引入两个概念。第一个是工作流，它可以让我们把这位天才教授放到流水线上去执行重复既定任务步骤；第二个是智能体（此时他变成了项目经理），它是解决AI被动的关键，用什么工具，跑哪条工作流，都是由这位项目经理自己主动拆解任务来完成。

四. 总结

层级	拟人名称	技术对应模块	核心定位	核心作用	核心短板
第一层（金字塔最底层）	核心大脑	基础大模型LLM	决策与思考中枢	语义理解、逻辑推理、文本生成、任务拆解	无感知、无法执行操作、知识滞后、易幻觉
第二层（金字塔中间层）	感官与四肢	多模态感知 + 基础交互	内外交互通道	采集外部数据、输出结果、基础人机交互	只能做数据收发，无法调用复杂工具、不能自主联网查资料
第三层（金字塔尖最高层）	骨骼与工具	工具框架，知识库，联网检索	行动支撑体系	标准化工具调用、流程编排、知识查询、自动化执行	依赖前两层能力，单独无法运行