使用LLM应用和提取不可言说知识

使用 LLM 应用和提取不可言说知识

一、与 LLM 交互的默认模式是复杂认知模式

由于 LLM 的回答具有不确定性,我们与 LLM 的默认交互模式是复杂认知模式,表现为:

  • 探测(Probe):向 LLM 提出问题或任务,LLM 产生初始结果
  • 感知(Sense):依照返回结果,思考哪些地方不满意或需要进一步了解,提出新问题或重新调整初始问题
  • 响应(Respond):通过不同的问题调整,最终拿到满意的结果

但这并不意味着 LLM 只能在复杂模式下发挥作用。当我们给予 LLM 一个非常明确的任务时(比如生成特定 SQL 查询),我们对于要做的修改有清晰的认识,实际上处在清晰的认知模式中------交互上表现为复杂模式,只是为了应对 LLM 的不确定性。

因此,讨论 LLM 的交互模式时,需要区分:哪些是应对 LLM 不确定性的,哪些是我们认知行为的体现。

二、清晰与庞杂模式下的 LLM 交互

清晰模式下,认知行为表现为感知(sense)- 归类(categorize)- 响应(Respond)。与 LLM 的交互方式是通过**指导性提示词(Instruction Prompting)**充分详细地描述任务的上下文和要求,让 LLM 负责生成最后的结果。

具体做法是使用提示词模板,将提取到的知识填入模板中。比如生成 RESTful API 的模板,将需求背景作为变量,API 要求作为固定约束,任务部分明确指定操作。除了直接套用模板执行任务之外,还可以通过**链(Chains)**建立复杂的任务------将 API 设计模板和功能实现模板串联,一次性完成从设计到编码的全流程。

庞杂模式下,认知行为表现为感知(sense)- 分析(analysis)- 响应(Respond)。与清晰模式的差别在于:我们并不知道具体的任务有哪些。这时候可以使用**知识生成(Generated Knowledge)**让 LLM 帮助分析要处理的问题------先抛开最终诉求,让 LLM 先生成一些关于最终诉求的知识(事实信息、规则或示例),再将这些生成的知识作为补充输入提供给 LLM。

庞杂模式下最有用的知识生成是生成任务列表,因为任务列表本来就是分析的结果,是思路的体现。对任务列表达成一致,就是思路的对齐。任务列表的生成可以通过**思维链(Chain of Thought,CoT)**来实现------在提示词中明确给出任务划分的依据和要求,鼓励 LLM 解释其推理过程。

三、复杂模式下的 LLM 交互与不可言说知识的提取

复杂模式下,我们对于要解决的问题甚至没有完整的思路,获取思路才是重点。

对比庞杂模式和复杂模式下 LLM 的返回结果,会发现复杂模式下还需要进一步的迭代与反馈,才能达到可用的状态。这形象地表现了未被充分学习已经被充分学习 的不可言说知识在 LLM 上的差别:能够转化为 CoT(或类似技术)的,就是已经被充分学习了的不可言说知识。因而,不可言说知识的提取就是提取 CoT 的过程

在复杂模式下,影响任务拆分效果的不可言说知识往往是关于架构的知识。我们可以在与 LLM 反馈学习的过程中,补充架构相关的知识,以提高任务列表的质量。

四、通过 RAG 学习已有的不可言说知识

除了通过反馈学习提取不可言说知识之外,发现并学习已经被提取出来的不可言说知识,也是复杂模式下一种重要的行为模式。目前比较流行的方式是使用检索增强生成(Retrieval Augmented Generation,RAG)

在 RAG 架构下,提出的问题并不会被直接处理,而是根据问题首先从知识库中检索相关片段,再将对应片段综合,生成最终的 prompt 提供给 LLM 进行回答。它包含根据问题检索、依据结果增强、增强之后生成三个部分。

在检索的基础上,可以通过提问进行互动学习,这是不可言说知识传递的重要模式。比如,要求 LLM 根据已经存在的不可言说知识,解释任务拆分的原因,从而帮助学习者理解背后的思维逻辑,而不仅仅是得到一个结果。

相关推荐
低调小一8 小时前
Midscene.js 原理拆解:它不是“自然语言点按钮”,而是一套会看屏幕的 UI 自动化运行时
人工智能·rnn·架构·大模型·transformer·tdd·midscene
楚国的小隐士8 小时前
在AI时代,如何从0接手一个项目?
java·ai·大模型·编程·ai编程·自闭症·自闭症谱系障碍·神经多样性
●VON11 小时前
四大AI生图工具横评:GPT Image 2 一骑绝尘!但Gemini的免费策略才是真正的王炸
人工智能·gpt·chatgpt·大模型·image
星辰徐哥11 小时前
AI辅助编程入门:大模型写代码靠谱吗
人工智能·ai·大模型·编程
树獭非懒17 小时前
Claude Code 完全入门指南:让你的 AI 从"会说"到"会做"
人工智能·程序员·llm
千桐科技18 小时前
qKnow 智能体构建平台开源版 2.1.0 正式发布:AI编排能力重磅升级,打造一站式私有化智能平台
人工智能·开源·大模型·ai应用·qknow·智能体构建平台·ai编排
绵满18 小时前
"OneTrans: Unified Feature Interaction and Sequence Modeling with One Transformer in Industrial Recommender" 论文笔记
大模型·推荐系统
sg_knight19 小时前
第一次用 OpenClaw,我让它 3 分钟写了个小工具
算法·llm·agent·ai编程·openclaw
V搜xhliang024620 小时前
OpenClaw进阶完全教程
运维·人工智能·算法·microsoft·自动化
__WanG20 小时前
Claude Code 多模型网关部署教程:从零实现多厂商大模型并行调度
ai·大模型·ai编程