使用大模型来维护知识库

一、核心思想

我们只负责输入资料,大模型来维护 wiki。这份wiki包含了原始资料索引,与agent的对话记录总结以及输出的报告等产物索引。wiki 是持久化的,无论我们与哪种 agent 工具对话,知识库都是基础的上下文,相当于给大模型植入了记忆。

二、架构

  • 原始资料:这部分资料是我们从各种途径搜集来的资料,可能有各种类别的,根据个人的知识库类型选择放什么资料。比如说我的个人博客,里面有一些我过往的技术资料,可以作为原始资料,用阅读的角度来说,这是我们要进行主题阅读的选材。

  • wiki:由大模型生成和维护,里面包含资料索引和各种产物,持久化的中间层。

  • 规则:一个与大模型交互的规则文件,比如我们用 cc 那就是 CLAUDE.md,用 codex,就是 AGENTS.md,文件名称可以根据情况自行定义。这份规则文件需要告诉大模型 wiki 的结构是怎样的,写作的行为习惯,以及维护 wiki 的工作流是怎样的。

三、怎么用

根据上面的概念,首先得有一个规则文件,放在根目录,然后是一个 wiki 目录用来跟大模型交互和沉淀产物,最后就是我们的原始资料啦。

  • 规则文件,可以这样写,可以根据自己的需求自行修改

  • wiki 目录,可以这样设计:

text 复制代码
wiki/
├── index.md      # 全库页面索引
├── log.md        # 追加式运维/操作记录
├── sources/      # 已吸收的原始资料
├── concepts/     # 跨资料合成的概念
├── queries/      # 值得长期保留的问答产出
└── reports/      # 较长的分析或报告产出
  • 原始资料,这里看使用场景,如果是要做一些新的主题阅读,可以新建一个 raw 目录用来存放原始资料,如果是已有资料库,可以直接不动,加入上面两种文件就行

我的博客目前就是用了这种方法去整合大模型的能力,建了个知识库,方便记录想法和归纳总结资料,写了这么多年的博客,感觉认知一直在增长,有些内容未必适合现在的情况,大模型维护知识库有个好处,可以快速的更新和记录认知变化,有点像我们的思想在不断进化这种感觉吧,感觉还是挺有用的。

这里只是展示 K 神的这个想法在知识整理上的应用,属于冰山一角。如果用到 agent 底层,这个理念是可以解决复杂工程和长上下文问题的,感觉挺厉害,先记录一下。

参考资料:

LLM Wiki

LLM Knowledge Bases

相关推荐
excel1 小时前
HLS TS 文件损坏的元凶:Git 提交与拉取
前端
DevOpenClub1 小时前
用 Agent 搭建网页内容采集与结构化处理流水线
人工智能
56AI1 小时前
2026 企业级AI智能体开发平台推荐:聚焦底层安全与准确率的智能体平台
人工智能·安全·智能体
Aphasia3111 小时前
https连接传输流程
前端·面试
徐小夕1 小时前
万字长文!千万级文档 RAG 知识库系统落地实践
前端·算法·github
沫儿笙1 小时前
库卡弧焊机器人白车身焊接节气装置
人工智能·机器人
AI智图坊2 小时前
多件装组合SKU图的批量生产效率分析:从PS手工到AI自动化的工作流改造
大数据·运维·人工智能·gpt·ai作画·自动化·aigc
threelab2 小时前
Three.js 物理模拟着色器 | 三维可视化 / AI 提示词
开发语言·前端·javascript·人工智能·3d·着色器
RSTJ_16252 小时前
PYTHON+AI LLM DAY SEVENTY-ONE
人工智能
kyriewen2 小时前
CSS Container Queries:彻底告别 @media 写到手软,附 5 个真实布局案例
前端·css·面试