使用大模型来维护知识库

一、核心思想

我们只负责输入资料,大模型来维护 wiki。这份wiki包含了原始资料索引,与agent的对话记录总结以及输出的报告等产物索引。wiki 是持久化的,无论我们与哪种 agent 工具对话,知识库都是基础的上下文,相当于给大模型植入了记忆。

二、架构

  • 原始资料:这部分资料是我们从各种途径搜集来的资料,可能有各种类别的,根据个人的知识库类型选择放什么资料。比如说我的个人博客,里面有一些我过往的技术资料,可以作为原始资料,用阅读的角度来说,这是我们要进行主题阅读的选材。

  • wiki:由大模型生成和维护,里面包含资料索引和各种产物,持久化的中间层。

  • 规则:一个与大模型交互的规则文件,比如我们用 cc 那就是 CLAUDE.md,用 codex,就是 AGENTS.md,文件名称可以根据情况自行定义。这份规则文件需要告诉大模型 wiki 的结构是怎样的,写作的行为习惯,以及维护 wiki 的工作流是怎样的。

三、怎么用

根据上面的概念,首先得有一个规则文件,放在根目录,然后是一个 wiki 目录用来跟大模型交互和沉淀产物,最后就是我们的原始资料啦。

  • 规则文件,可以这样写,可以根据自己的需求自行修改

  • wiki 目录,可以这样设计:

text 复制代码
wiki/
├── index.md      # 全库页面索引
├── log.md        # 追加式运维/操作记录
├── sources/      # 已吸收的原始资料
├── concepts/     # 跨资料合成的概念
├── queries/      # 值得长期保留的问答产出
└── reports/      # 较长的分析或报告产出
  • 原始资料,这里看使用场景,如果是要做一些新的主题阅读,可以新建一个 raw 目录用来存放原始资料,如果是已有资料库,可以直接不动,加入上面两种文件就行

我的博客目前就是用了这种方法去整合大模型的能力,建了个知识库,方便记录想法和归纳总结资料,写了这么多年的博客,感觉认知一直在增长,有些内容未必适合现在的情况,大模型维护知识库有个好处,可以快速的更新和记录认知变化,有点像我们的思想在不断进化这种感觉吧,感觉还是挺有用的。

这里只是展示 K 神的这个想法在知识整理上的应用,属于冰山一角。如果用到 agent 底层,这个理念是可以解决复杂工程和长上下文问题的,感觉挺厉害,先记录一下。

参考资料:

LLM Wiki

LLM Knowledge Bases

相关推荐
魔术师Grace2 分钟前
我给 AI 做了场入职培训
前端·程序员
马丁聊GEO15 分钟前
解码AI用户心智,筑牢可信GEO根基——悠易科技深度参与《中国AI用户态度与行为研究报告(2026)》发布会
人工智能·科技
nap-joker20 分钟前
Fusion - Mamba用于跨模态目标检测
人工智能·目标检测·计算机视觉·fusion-mamba·可见光-红外成像融合·远距离/伪目标问题
一只幸运猫.31 分钟前
2026Java 后端面试完整版|八股简答 + AI 大模型集成技术(最新趋势)
人工智能·面试·职场和发展
Promise微笑37 分钟前
2026年国产替代油介损测试仪:油介损全场景解决方案与技术演进
大数据·网络·人工智能
深海鱼在掘金43 分钟前
深入浅出 LangChain —— 第三章:模型抽象层
人工智能·langchain·agent
生信碱移44 分钟前
PACells:这个方法可以鉴定疾病/预后相关的重要细胞亚群,作者提供的代码流程可以学习起来了,甚至兼容转录组与 ATAC 两种数据类型!
人工智能·学习·算法·机器学习·数据挖掘·数据分析·r语言
玩嵌入式的菜鸡1 小时前
网页访问单片机设备---基于mqtt
前端·javascript·css
workflower1 小时前
具身智能行业应用-生活服务业
大数据·人工智能·机器人·动态规划·生活
前端一小卒1 小时前
我用 Claude Code 的 Superpowers 技能链写了个服务,部署前差点把服务器搞炸
前端·javascript·后端