使用大模型来维护知识库

一、核心思想

我们只负责输入资料,大模型来维护 wiki。这份wiki包含了原始资料索引,与agent的对话记录总结以及输出的报告等产物索引。wiki 是持久化的,无论我们与哪种 agent 工具对话,知识库都是基础的上下文,相当于给大模型植入了记忆。

二、架构

  • 原始资料:这部分资料是我们从各种途径搜集来的资料,可能有各种类别的,根据个人的知识库类型选择放什么资料。比如说我的个人博客,里面有一些我过往的技术资料,可以作为原始资料,用阅读的角度来说,这是我们要进行主题阅读的选材。

  • wiki:由大模型生成和维护,里面包含资料索引和各种产物,持久化的中间层。

  • 规则:一个与大模型交互的规则文件,比如我们用 cc 那就是 CLAUDE.md,用 codex,就是 AGENTS.md,文件名称可以根据情况自行定义。这份规则文件需要告诉大模型 wiki 的结构是怎样的,写作的行为习惯,以及维护 wiki 的工作流是怎样的。

三、怎么用

根据上面的概念,首先得有一个规则文件,放在根目录,然后是一个 wiki 目录用来跟大模型交互和沉淀产物,最后就是我们的原始资料啦。

  • 规则文件,可以这样写,可以根据自己的需求自行修改

  • wiki 目录,可以这样设计:

text 复制代码
wiki/
├── index.md      # 全库页面索引
├── log.md        # 追加式运维/操作记录
├── sources/      # 已吸收的原始资料
├── concepts/     # 跨资料合成的概念
├── queries/      # 值得长期保留的问答产出
└── reports/      # 较长的分析或报告产出
  • 原始资料,这里看使用场景,如果是要做一些新的主题阅读,可以新建一个 raw 目录用来存放原始资料,如果是已有资料库,可以直接不动,加入上面两种文件就行

我的博客目前就是用了这种方法去整合大模型的能力,建了个知识库,方便记录想法和归纳总结资料,写了这么多年的博客,感觉认知一直在增长,有些内容未必适合现在的情况,大模型维护知识库有个好处,可以快速的更新和记录认知变化,有点像我们的思想在不断进化这种感觉吧,感觉还是挺有用的。

这里只是展示 K 神的这个想法在知识整理上的应用,属于冰山一角。如果用到 agent 底层,这个理念是可以解决复杂工程和长上下文问题的,感觉挺厉害,先记录一下。

参考资料:

LLM Wiki

LLM Knowledge Bases

相关推荐
kyriewen8 小时前
Anthropic 估值逼近万亿美元,Claude Sonnet 5 + Claude Science 一天两连发
前端·ai编程·claude
冬奇Lab9 小时前
Workflow 系列(04):Multi-Agent 协调——编排器边界、并发控制与上下文隔离
人工智能·工作流引擎
冬奇Lab9 小时前
每日一个开源项目(第147篇):HyperGraphRAG - 用超图表示 N 元关系,RAG 的第三代范式
人工智能·开源·graphql
甲维斯9 小时前
Github + 阿里云oss实现类似codex的自动更新!
人工智能
小徐_233310 小时前
Wot UI 2.2.0 发布:Button 新增 subtle,VideoPreview 预览体验继续增强
前端·微信小程序·uni-app
阿里云大数据AI技术11 小时前
光轮智能 × 阿里云:共建 Physical AI 云上数据、评测与持续学习基础设施
人工智能·机器学习
机器之心11 小时前
实锤了:Claude Code偷查用户,时区、中国AI实验室全是关键词
人工智能·openai
网易云信11 小时前
Cursor点燃个人开发者,企业级AI为何频频受挫?Agent工厂从提效工具到AI员工的跃迁
人工智能·开源