使用大模型来维护知识库

一、核心思想

我们只负责输入资料，大模型来维护 wiki。这份wiki包含了原始资料索引，与agent的对话记录总结以及输出的报告等产物索引。wiki 是持久化的，无论我们与哪种 agent 工具对话，知识库都是基础的上下文，相当于给大模型植入了记忆。

二、架构

原始资料：这部分资料是我们从各种途径搜集来的资料，可能有各种类别的，根据个人的知识库类型选择放什么资料。比如说我的个人博客，里面有一些我过往的技术资料，可以作为原始资料，用阅读的角度来说，这是我们要进行主题阅读的选材。
wiki：由大模型生成和维护，里面包含资料索引和各种产物，持久化的中间层。
规则：一个与大模型交互的规则文件，比如我们用 cc 那就是 CLAUDE.md，用 codex，就是 AGENTS.md，文件名称可以根据情况自行定义。这份规则文件需要告诉大模型 wiki 的结构是怎样的，写作的行为习惯，以及维护 wiki 的工作流是怎样的。

三、怎么用

根据上面的概念，首先得有一个规则文件，放在根目录，然后是一个 wiki 目录用来跟大模型交互和沉淀产物，最后就是我们的原始资料啦。

规则文件，可以这样写，可以根据自己的需求自行修改
wiki 目录，可以这样设计：

text 复制代码

wiki/
├── index.md      # 全库页面索引
├── log.md        # 追加式运维/操作记录
├── sources/      # 已吸收的原始资料
├── concepts/     # 跨资料合成的概念
├── queries/      # 值得长期保留的问答产出
└── reports/      # 较长的分析或报告产出

原始资料，这里看使用场景，如果是要做一些新的主题阅读，可以新建一个 raw 目录用来存放原始资料，如果是已有资料库，可以直接不动，加入上面两种文件就行

我的博客目前就是用了这种方法去整合大模型的能力，建了个知识库，方便记录想法和归纳总结资料，写了这么多年的博客，感觉认知一直在增长，有些内容未必适合现在的情况，大模型维护知识库有个好处，可以快速的更新和记录认知变化，有点像我们的思想在不断进化这种感觉吧，感觉还是挺有用的。

这里只是展示 K 神的这个想法在知识整理上的应用，属于冰山一角。如果用到 agent 底层，这个理念是可以解决复杂工程和长上下文问题的，感觉挺厉害，先记录一下。

参考资料：

LLM Wiki

LLM Knowledge Bases