用 39 元跑出 1.3B token 的代码知识库：OpenDeepWiki 最新 wiki 质量抽检

本文基于 2026-06-09 对 OpenDeepWiki 与 AIDotNet/Means 生成页的一次源码与页面抽检。样本里的生成配置是：目录由 gpt-5.5 生成，正文由 Mimo-2.5 生成；Mimo 侧累计消费约 1.3B token，总成本约 39 RMB，折算约 0.03 RMB / 百万 token。

先说结论

OpenDeepWiki 这轮生成质量已经明显超过"README 扩写器"。它能把一个 .NET 对象存储项目拆成 22 个左右的主题页，覆盖 S3 数据面、XlFs 存储层、Console 管理面、后台任务、可观测性、SDK、部署和测试等模块，并且页面底部会保留读过的源码文件列表。作为新项目的第一轮知识库，它非常有价值。

但它还不能直接等同于"事实数据库"。我在 Means 这篇概览页里发现了一个典型风险：页面将 Reed-Solomon EC 写入和真实 Rebalance 归入"尚未实现"，但当前 Means 仓库 README 与源码中已经有 reed-solomon-v1 写入路径、RebalanceObjectReplicasAsync 以及 Reed-Solomon/full-copy 两类 rebalance 分支。这可能是生成快照滞后，也可能是模型过度相信计划文档。无论原因是什么，它都说明：OpenDeepWiki 很适合做"第一版工程理解"，但高风险状态判断仍需要自动校验或人工抽检。

OpenDeepWiki 到底是什么

从最新版仓库看，OpenDeepWiki 不是一个简单的文档生成脚本，而是一套代码知识库平台。它可以从 Git URL、ZIP 包、本地目录导入仓库，生成结构化 wiki、README 摘要、多语言内容、思维导图和可选 Graphify 产物，再把同一份知识复用到公开文档站、内置聊天、嵌入式聊天 API 和 MCP 端点里。

截至我查询时，GitHub API 显示 AIDotNet/OpenDeepWiki 大约有 3.3k stars、425 forks、MIT 许可证，最近 release 是 v2.0.3，发布于 2026-05-30；主分支最近一次推送在 2026-06-04。技术栈也比较激进：后端是 ASP.NET Core / .NET 10，前端是 Next.js 16 + React 19，数据库支持 SQLite 和 PostgreSQL，AI 编排使用 Microsoft.Agents.AI，仓库处理依赖 LibGit2Sharp。

最关键的是，它的生成链路支持"目录模型"和"内容模型"分离。源码里的 WikiGeneratorOptions 有独立的 CatalogModel、ContentModel、TranslationModel、并发数、输出 token 上限和文档生成超时。也就是说，你这次"目录用 gpt-5.5、正文用 Mimo-2.5"的配置不是临时 hack，而是 OpenDeepWiki 的核心设计方向：用更强模型做信息架构，用更便宜模型铺开正文深度。

它的生成链路为什么值得关注

OpenDeepWiki 的文档生成不是把整个仓库一次塞给模型。它会先收集仓库上下文，包括 README、目录树、入口文件和项目类型；目录阶段给模型 ListFiles、ReadFile、Grep、WriteCatalog 等工具；正文阶段再给模型读源码、搜索实现、写文档和追加文档的工具。

这几个细节很重要：

GitTool 会记录模型读过哪些文件，最终反映到页面底部的 Sources。
DocTool 支持 WriteDoc 和 AppendDoc，所以长文档不是一次响应写完，而是分段累积。
内容提示词明确要求代码示例来自真实文件、图表反映真实结构、冲突时选择最新或更权威来源。
TokenUsage 会记录输入、输出、缓存 token、模型 ID 和业务操作，后续可以做成本核算。

这解释了为什么 1.3B token 这个数字看起来吓人但合理：真正昂贵的不是最终页面字数，而是反复读源码、搜索、工具调用、多页面并发、失败重试和多语言/图谱等后续任务。

Means 这篇 wiki 好在哪里

第一，目录结构是懂项目边界的。Means 是 S3-compatible 对象存储，不是普通 CRUD 项目。生成结果把 S3 数据面拆到地址解析、SigV4、Bucket/Object、版本控制、Lifecycle/CORS/Notification/Policy、XML 错误模型等主题；把存储层拆到 XlFs、MeansLogDb、写入原子性、multipart 与生命周期；还单独覆盖 Console、可观测性、SDK 和测试。这种拆法不是文件树映射，而是读者理解系统时真正会问的问题。

第二，正文密度足够。页面不是只说"支持 S3 API"，而是列出 Bucket CRUD、Object CRUD、ListObjectsV2、Multipart、Versioning、Lifecycle、CORS、Notification、Tagging、Policy 和预签名 URL 等能力。对一个评估对象存储项目的人来说，这种矩阵比泛泛而谈有用得多。

第三，Sources 是非常实用的可信度锚点。

这篇概览页显示读取了 29 个文件，包含 README、IMPLEMENTATION_PLAN、compose、解决方案文件、S3 endpoint、XlFsStore、配置、后台任务和 SDK 文件。即便正文有误，读者也能立刻回到源码入口复核。对 AI 生成文档来说，Sources 不是锦上添花，而是底线。

但问题也很清楚

最大的问题在"能力边界"部分。页面写得很像人工架构评审：明确列出 Replication、Object Lock、IAM/STS、多节点分布式数据分片、Reed-Solomon EC 写入、真实 Rebalance 等边界。这本来是非常好的写法，因为它避免把 roadmap 说成已实现。

问题是，当前 Means 仓库里能看到与页面结论冲突的实现信号：

README 已说明普通 PutObject 在本地在线磁盘满足条件时会写入 reed-solomon-v1 shards。
XlFsStore.IO.cs 里存在 Reed-Solomon 写入路径和相关 Galois field 计算逻辑。
XlFsStore.ClusterMaintenance.cs 中 RebalanceObjectReplicasAsync 会区分 Reed-Solomon manifest 和 full-copy manifest，走不同 rebalance 分支。

这不代表 OpenDeepWiki 整体失败。相反，它暴露的是"AI 代码文档生成"最难的一类问题：状态判断。实现计划、README、旧文档、源码和当前分支之间可能互相矛盾，模型需要判断谁更新、谁更权威、谁只是预留接口。OpenDeepWiki 的提示词已经要求遇到冲突选择最新/权威来源，但从这个样本看，这条规则还需要更强的工程化保障。

39 RMB 的真正意义

1.3B token / 39 RMB，粗算约 0.03 RMB / 百万 token。这个成本水平会改变文档生成的经济模型：过去大家担心"文档生成太贵"，现在更现实的问题变成"便宜到可以大规模生成之后，谁来做质量闸门"。

目录用强模型、内容用便宜模型的策略是合理的。目录是知识库的骨架，一旦拆错，后面每页都会错位；正文则更适合用便宜模型在工具约束下展开。但低价模型更容易在状态边界、跨文件冲突、计划与实现关系上犯错，所以抽检重点不应该是文风，而应该是：

已实现 / 未实现的判断是否与当前分支一致。
配置默认值是否来自源码而不是旧文档。
API 支持矩阵是否能在 endpoint、测试或 SDK spec 中找到证据。
Mermaid 图是否真正渲染，且不是理想化架构图。
Sources 是否覆盖核心实现，而不是只读 README 和计划文档。

我会怎么给它打分

如果只评这次 Means 样本，我的主观评分如下：

维度	评分	说明
信息架构	9/10	目录拆分很接近工程师理解路径，不是文件级堆砌。
技术深度	8/10	能覆盖协议、存储、后台任务、配置和测试，正文密度够。
可追溯性	8.5/10	Sources 很有用，但正文里的关键断言仍缺少逐条证据标记。
新鲜度/状态判断	6.5/10	能力边界有疑似滞后或误判，需要版本快照和冲突检测。
经济性	9.5/10	这个 token 单价下，批量生成非常有吸引力。
可发布性	7.5/10	适合做公开 wiki 初稿；核心能力边界发布前要抽检。

对 OpenDeepWiki 的改进建议

第一，每个页面都应该展示生成时的仓库 commit SHA、生成时间、目标分支和模型配置。现在页面显示分支是 master，但没有把"这篇内容到底基于哪个源码快照"暴露给读者。对快速迭代项目来说，这会直接影响信任。

第二，为"能力状态"类断言加自动复核。比如页面说某功能未实现，可以自动 grep NotImplemented、相关 public API、测试名、README 状态和实现类，生成一个小型 contradiction report。模型可以继续写自然语言，但状态结论要经过工具校验。

第三，Sources 可以更进一步：不仅列文件，还标注每个文件贡献了哪些主题。读者看到 29 个文件很好，但不知道"Rebalance 判断来自哪个文件"。如果能按段落显示主要证据文件，可信度会更高。

第四，成本统计应该下钻到 repo、语言、阶段、页面。1.3B token 是总量，真正做运营时更想知道：目录消耗多少、正文每页多少、失败重试多少、缓存命中多少、哪些页面最贵、哪些模型最容易重试。

第五，Mermaid 渲染需要质量检查。抓取文本时我看到若干 Loading diagram... 占位，浏览器截图里有些图能渲染，但尺寸较小。对公开 wiki 来说，图表渲染失败应进入页面质量告警。

最后

OpenDeepWiki 的价值不在于"AI 自动写文档"这句口号，而在于它已经把代码知识库做成了一条可运营的流水线：导入、分析、目录生成、正文生成、翻译、思维导图、Graphify、聊天、MCP、token 统计和后台任务管理都在一个系统里。

这次 Means 样本说明，它已经能生成一份对工程师有实际帮助的项目 wiki；同时也提醒我们，AI 生成文档最危险的不是文风，而是"看起来非常确定的状态判断"。当 39 RMB 就能跑出 1.3B token 的内容时，生成本身不再稀缺，可靠的验证链路才是稀缺资源。

我的判断是：OpenDeepWiki 已经适合作为开源项目知识库的自动初稿系统，也适合作为团队内部代码理解入口；如果要把它作为权威对外文档，还需要把 commit 快照、关键断言校验和质量评分做成产品能力。那会是它从"好用的 AI wiki"变成"可信的工程知识库"的关键一步。