Google NotebookLM 的最强开源替代品 ------ 隐私优先、多模型支持、完全自托管,28.6k Star 的明星项目全方位解读
| ⭐ 28.6k Stars | 🍴 3.2k Forks | 📦 v1.9.0 (2026.06) | 📄 MIT License | 🐍 Python + TypeScript |
目录
一、项目背景与定位
"Take Control of Your Learning. Privately." ------ 掌控你的学习,保护你的隐私。
什么是 Open Notebook?
Open Notebook 是一款开源、AI 驱动的笔记与研究平台 ,由开发者 lfnovo 创建并维护,定位为 Google NotebookLM(谷歌的 AI 笔记工具)的完全开源替代品。它将强大的 AI 能力与严格的隐私控制相结合,专为研究人员、学生和知识工作者设计。
项目诞生于一个核心理念:用户应当完全拥有自己的数据和 AI 工作流。不同于 Google NotebookLM 将数据锁定在云端生态中,Open Notebook 让你可以在本地或私有服务器上运行所有功能,自主决定使用哪个 AI 模型、如何处理内容、以及谁能访问你的笔记。
项目数据一览
| 维度 | 详情 |
|---|---|
| ⭐ 社区热度 | GitHub 上已获得 28.6k Stars 和 3.2k Forks,活跃贡献者持续增长,是 AI 开源领域最热门的项目之一 |
| 🔄 版本迭代 | 截至 2026 年 6 月已发布 v1.9.0 版本,从 MVP 到成熟产品经历了快速迭代,平均每两周一个大更新 |
| 🌍 国际化覆盖 | 支持英语、葡萄牙语、中文(简/繁)、日语、俄语、孟加拉语等 7+ 语言界面,全球社区活跃 |
| 🏗️ 技术成熟度 | 采用 MIT 协议开源,代码库规模可观,包含完整的测试套件、Docker 化部署、REST API 文档等工程基础设施 |
二、核心功能全景
基础能力矩阵
🔒 隐私优先架构
所有数据存储在本地或自托管服务器中,无强制云依赖。可选密码保护机制,确保公开部署时的安全性。精细控制哪些信息可以被 AI 访问。
📚 多模态内容支持
支持导入 PDF 文档、YouTube 视频、音频文件、网页链接、Office 文档(Word/Excel/PPT)、纯文本等多种格式,统一纳入知识管理。
🤖 多模型 AI 对话
基于上传的研究材料进行上下文感知对话,AI 回答附带来源引用,支持推理模型(如 DeepSeek-R1)的思维链能力。
🎙️ 播客生成器
将研究笔记转化为专业播客音频,支持 1-4 位说话人自定义配置,可设定不同角色风格和 Episode Profiles(剧集档案)。
🔍 双引擎搜索
同时提供全文搜索 (关键词匹配)和向量语义搜索(基于 Embedding 的相似度检索),精准定位知识片段。
💬 多会话聊天
每个 Notebook 下可创建多个独立聊天会话,支持不同的研究角度和上下文隔离,方便并行探索多个问题方向。
高级功能亮点
| 功能 | 说明 |
|---|---|
| ⚡ 推理模型支持 | DeepSeek-R1 / Qwen3 等思维链模型 |
| 🔧 可定制内容转换管道 | 自定义摘要与洞察提取规则 |
| 🌐 完整 REST API | 全程序化访问与集成能力 |
| 📎 引用溯源系统 | AI 回答附带来源引用 |
| 🔐 可选密码保护 | 公开部署时的安全认证 |
| 📊 精细上下文控制 | 精确控制与 AI 共享的内容范围 |
| 🔄 内容转换自动化 | 内置多种内容转换模板 |
| 🤖 MCP 协议集成 | 对接 Claude Desktop / VS Code 等 AI 客户端 |
其中值得特别关注的是 MCP(Model Context Protocol)集成------Open Notebook 支持通过标准 MCP 协议与 Claude Desktop、VS Code 等 AI 客户端无缝对接,使其可以作为一个"外部知识大脑"为其他 AI 工具提供上下文支撑。这大大扩展了产品的应用边界。
三、技术架构深度剖析
整体技术栈
| 层次 | 技术选型 | 说明 |
|---|---|---|
| 前端框架 | Next.js + React + TypeScript |
现代 SSR/SSG 前端,TypeScript 占代码量 64.6% |
| 后端框架 | FastAPI (Python) |
高性能异步 REST API 框架,自动生成 OpenAPI 文档 |
| AI 编排层 | LangChain + Esperanto 库 |
统一抽象 18+ AI 提供商接口,提示词模板用 Jinja2 管理 |
| 数据库 | SurrealDB |
新兴多模型数据库,原生支持全文搜索 + 向量搜索 |
| 容器化 | Docker + Docker Compose |
支持双服务部署和单容器部署两种模式 |
| 进程管理 | Supervisord |
单容器内同时管理 DB 和应用两个进程 |
项目目录结构
open-notebook/
├── api/ # REST API 路由与处理逻辑
├── commands/ # CLI 命令行工具
├── docs/ # 项目文档
│ └── 1-INSTALLATION/ # 安装指南(Docker/源码/云平台)
├── examples/ # 示例配置(Ollama 本地集成等)
├── frontend/ # Next.js 前端源码
├── open_notebook/ # 核心 Python 模块包
│ ├── core/ # 核心业务逻辑
│ ├── models/ # 数据模型定义
│ ├── services/ # 服务层(AI/搜索/转换)
│ └── utils/ # 工具函数
├── prompts/ # Jinja2 AI 提示词模板
├── scripts/ # 辅助脚本
├── tests/ # 测试套件
├── Dockerfile # 多服务容器镜像
├── Dockerfile.single # 单容器镜像(含 Supervisord)
├── docker-compose.yml # 编排文件
├── supervisord.conf # 进程管理配置
└── run_api.py # API 启动入口
双服务部署架构
┌─────────────────────┐
│ 🌐 用户浏览器 │
└──────────┬──────────┘
│
▼
┌──────────────────────────────────────────────────────────────┐
│ Open Notebook 应用服务 (端口 8502 / 5055) │
│ │
│ ┌─────────────────────┐ ┌─────────────────────┐ │
│ │ 🟢 Next.js 前端 │ │ 🟠 FastAPI 后端 │ │
│ │ TS · React :8502 │ │ Py · LangChain:5055│ │
│ └─────────────────────┘ └─────────────────────┘ │
│ │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌────┐ │
│ │AI 编排层 │ │内容处理 │ │播客生成器 │ │... │ │
│ └──────────┘ └──────────┘ └──────────┘ └────┘ │
└──────────────────────────────────────────────────────────────┘
│
▼
┌──────────────────────────────────────────────────┐
│ 🗄️ SurrealDB (端口 8000) --- 向量搜索 + 全文搜索 │
└──────────────────────────────────────────────────┘
关键技术决策解析
🗄️ 为什么选择 SurrealDB?
SurrealDB 是一个新兴的多模型数据库,它同时支持文档、关系、图和向量数据模型。对于 Open Notebook 来说,最大的价值在于原生集成了全文搜索和向量搜索,无需额外引入 Elasticsearch 或专门的向量数据库(如 Pinecone/Milvus),大大简化了部署复杂度。
🔗 为什么选择 FastAPI?
FastAPI 基于 Pydantic 提供自动的数据校验和序列化,原生支持异步操作,性能优异。其自动生成的 OpenAPI/Swagger 文档对 REST API 的使用者极为友好------而 Open Notebook 的 API 正是其区别于竞品的核心差异化功能之一。
🧩 Esperanto 统一层的设计哲学
项目中使用名为 "Esperanto" 的内部库来统一抽象所有 AI 提供商接口。这意味着新增一个 AI 提供商只需实现统一的适配器接口,而不需要在业务逻辑中到处写 if-else 分支。这种适配器模式让项目目前能轻松支持 18+ 家厂商。
📝 Jinja2 提示词模板管理
AI 提示词(Prompts)统一以 Jinja2 模板形式存放在 prompts/ 目录下。这使得提示词可以像代码一样版本化管理,也允许高级用户自定义提示词模板来调整 AI 行为------体现了"可定制化"的产品理念。
四、AI 提供商生态矩阵
Open Notebook 最突出的优势之一就是其对 AI 提供商的广泛支持。通过统一的 Esperanto 适配层,项目目前已兼容 18+ 家 AI 服务提供商,涵盖大语言模型、Embedding 模型、语音转文字(STT)和文字转语音(TTS)四大类能力。
提供商支持详情表
| 提供商 | LLM | Embedding | STT | TTS |
|---|---|---|---|---|
| OpenAI | ✅ | ✅ | ✅ | ✅ |
| Anthropic | ✅ | --- | --- | --- |
| Groq | ✅ | --- | ✅ | --- |
| Google GenAI | ✅ | ✅ | ✅ | ✅ |
| Vertex AI | ✅ | ✅ | --- | ✅ |
| Ollama | ✅ | ✅ | --- | --- |
| Azure OpenAI | ✅ | ✅ | ✅ | ✅ |
| Mistral | ✅ | ✅ | ✅ | ✅ |
| DeepSeek | ✅ | --- | --- | --- |
| xAI (Grok) | ✅ | --- | --- | ✅ |
| OpenRouter | ✅ | ✅ | --- | --- |
| DashScope (通义千问) | ✅ | --- | --- | --- |
| ElevenLabs | --- | --- | ✅ | ✅ |
| OpenAI 兼容接口* | ✅ | ✅ | ✅ | ✅ |
* 支持 LM Studio 及任何遵循 OpenAI API 格式的兼容端点,这意味着理论上可以接入几乎所有本地/私有化部署的模型服务。
实际意义
这个生态矩阵意味着用户拥有极大的灵活性和成本优化空间:
- 零成本方案:使用 Ollama 本地运行开源模型(如 Llama 3、Qwen),完全免费且数据不出机器
- 高性能方案:Groq 提供超低延迟推理,适合实时交互场景
- 企业合规方案:Azure OpenAI 或 Vertex AI 满足数据驻留要求
- 最佳 TTS 方案:ElevenLabs 业界领先的语音合成质量
- 混合策略:LLM 用 DeepSeek(性价比高),Embedding 用 OpenAI,TTS 用 ElevenLabs ------ 各取所长
五、快速部署实战指南
Open Notebook 提供多种部署方式,最推荐的是 Docker Compose 一键部署,整个过程大约只需 2 分钟。
方式一:Docker Compose 部署(推荐)
步骤 1:获取 docker-compose.yml
创建工作目录并下载编排文件:
bash
# 方式A:直接下载
curl -o docker-compose.yml \
https://raw.githubusercontent.com/lfnovo/open-notebook/main/docker-compose.yml
# 方式B:手动创建(见下方代码块)
步骤 2:编写编排文件
yaml
services:
surrealdb:
image: surrealdb/surrealdb:v2
command: start --log info --user root --pass root rocksdb:/mydata/mydatabase.db
ports:
- "8000:8000"
volumes:
- ./surreal_data:/mydata
restart: always
open_notebook:
image: lfnovo/open_notebook:v1-latest
ports:
- "8502:8502" # 前端 UI
- "5055:5055" # REST API
environment:
- OPEN_NOTEBOOK_ENCRYPTION_KEY=your-secret-key-here
- SURREAL_URL=ws://surrealdb:8000/rpc
- SURREAL_USER=root
- SURREAL_PASSWORD=root
- SURREAL_NAMESPACE=open_notebook
- SURREAL_DATABASE=open_notebook
volumes:
- ./notebook_data:/app/data
depends_on:
- surrealdb
restart: always
步骤 3:启动服务
bash
docker compose up -d
等待约 15-20 秒后,浏览器访问 http://localhost:8502 即可看到 Open Notebook 界面。
步骤 4:配置 AI 提供商
进入 Settings → API Keys → Add Credential → 选择提供商 → 粘贴密钥 → Test Connection → Discover Models → Register Models。完成!
其他部署选项
| 部署方式 | 适合场景 | 特点 |
|---|---|---|
| Ollama 本地模式 | 个人使用、零预算 | 无需 API 费用,完全离线运行 |
| 单容器部署 | 资源受限环境 | Dockerfile.single 内置 Supervisord 管理双进程 |
| 源码安装 | 开发者和贡献者 | 可修改源码、调试方便 |
| 云端部署 | 团队协作、远程访问 | 配合域名和 HTTPS 使用 |
六、竞品对比分析
Open Notebook vs Google NotebookLM
| 对比维度 | Open Notebook | Google NotebookLM |
|---|---|---|
| 🔒 隐私与数据主权 | ✅ 自托管,数据完全自主可控 | ❌ 数据锁定在 Google 云端 |
| 🤖 AI 模型灵活性 | ✅ 18+ 提供商自由切换 | ❌ 仅限 Google 自家模型 |
| 🎙️ 播客生成 | ✅ 1-4 位说话人 + 角色自定义 | ❌ 固定 2 位说话人 |
| 🔧 定制化程度 | ✅ 开源可改、Prompt 可定制 | ❌ 封闭系统,无定制空间 |
| 🌐 API 访问 | ✅ 完整 REST API,支持程序化集成 | ❌ 无公开 API |
| 💰 费用模式 | ✅ 仅支付所选 AI 提供商用量的费用 | ❌ 免费层受限,需订阅 Google One |
| 🚀 部署灵活性 | ✅ Docker/云/本地均可部署 | ❌ 仅能在 Google 平台使用 |
| 📊 成熟度与稳定性 | ❌ 社区驱动的开源项目 | ✅ Google 官方维护,稳定性高 |
| 🎨 UI 体验 | ❌ 功能完善但打磨度待提升 | ✅ Google 设计团队出品,交互流畅 |
| 📈 生态整合 | ❌ 独立项目,需自行对接 | ✅ 深度整合 Google Workspace |
核心竞争力总结
Open Notebook 的核心价值主张不是"做得比 Google 更好",而是**"把选择权交还给用户"**。如果你重视数据隐私、需要灵活的模型选择、或者想要将 AI 笔记能力集成到自己的工作流中 ------ Open Notebook 目前没有对手。当然,作为开源项目,它在 UI 精细度和生态整合方面仍有提升空间,但这正是开源社区的乐趣所在。
七、适用场景与用户画像
典型用户画像
📚 知识学习者 / 学生
需要深度理解课程材料、论文、技术文档。利用 AI 对话澄清概念、生成摘要播客来复习,构建自己的知识体系而非被动接收信息。
🔬 学术研究者
大量 PDF 论文和文献需要整理归纳。上传论文后进行跨文献对比问答,自动提取关键发现,加速文献综述过程。
💼 专业分析师 / 咨询师
持续跟踪行业报告、新闻资讯和市场动态。将各类资料汇入 Notebook 后进行智能问答和洞察提取,辅助决策报告撰写。
🔒 隐私敏感用户
不希望个人想法、商业计划和研究笔记暴露在大型科技公司的平台上。自托管部署确保数据完全在自身掌控之中。
⚙️ 技术爱好者 / 开发者
希望通过 REST API 将 AI 笔记能力集成到自有系统中,或利用 MCP 协令连接 Claude Desktop / VS Code 构建个性化 AI 工作台。
🎙️ 内容创作者
将研究素材转化为播客内容,利用多说话人功能制作更有趣的知识分享节目,降低内容生产门槛。
典型工作流示例
① 收集素材
导入 PDF 论文、保存网页链接、上传 YouTube 视频 ------ 所有格式的内容统一进入同一个 Notebook。
② AI 处理与索引
系统自动进行内容提取、分块、Embedding 编码,建立全文索引和向量索引。
③ 智能问答与探索
基于全部素材向 AI 提问,答案附带来源引用。创建多个会话从不同角度深入探究。
④ 输出生成成果
生成结构化笔记摘要、导出研究报告,或将整个研究转化为一期多人播客。
八、未来路线图
即将推出(Roadmap)
| 功能 | 说明 |
|---|---|
| ⚡ 实时前端更新 | 引入 WebSocket 或 SSE 实现 UI 的实时刷新,让长耗时任务(如大文件处理、播客生成)的状态反馈更流畅自然 |
| 🔄 异步处理引擎 | 将耗时的内容处理(文件解析、Embedding 计算、播客渲染)改为后台异步执行,大幅提升前端响应速度 |
| 🔗 跨 Notebook 资源共享 | 支持在不同研究项目之间复用已导入的材料和笔记,避免重复上传,构建个人知识图谱 |
| 📖 书签集成 | 与主流书签应用(如 Pocket、Raindrop.io 等)对接,一键将收藏的文章同步到 Notebook 进行 AI 分析 |
长期愿景
根据 Open Notebook 官方描述,项目的长期目标是打造每个人的**"个性化认知伙伴(Cognitive Partner)"** ------ 不仅是一个笔记工具,而是能够根据用户的认知风格、知识结构和学习偏好,主动帮助发展技能、知识和观点的 AI 助手。当前版本仅仅是这个愿景的第一步。
九、总结与评价
项目综合评分
| 评估维度 | 评分 | 说明 |
|---|---|---|
| 功能完整性 | ⭐⭐⭐⭐⭐ | 笔记、对话、搜索、播客、API 一应俱全 |
| 技术架构 | ⭐⭐⭐⭐☆ | 技术选型合理,SurrealDB 大胆但有效 |
| 易用性 | ⭐⭐⭐⭐☆ | Docker 一键部署,UI 配置直观 |
| 文档质量 | ⭐⭐⭐⭐☆ | 安装指南详细,API 文档齐全 |
| 社区活跃度 | ⭐⭐⭐⭐⭐ | 28.6k Star,Discord 社区活跃 |
| 隐私安全 | ⭐⭐⭐⭐⭐ | 完全自托管,数据主权归用户 |
| 扩展性 | ⭐⭐⭐⭐⭐ | REST API + MCP + 自定义 Prompt |
最终结论
Open Notebook 是 2025-2026 年 AI 开源领域最具影响力的项目之一。它不仅是一个功能完备的工具,更是AI 民主化和数据主权运动的一个缩影 ------ 证明了一群充满热情的开发者可以做出足以挑战科技巨头闭源产品的替代方案。
对于以下人群,我强烈推荐尝试 Open Notebook:
- 关注数据隐私的个人用户
- 需要 AI 辅助学术研究的师生
- 想集成 AI 能力的开发者
- 追求工具链自主可控的技术爱好者
📎 项目地址 :https://github.com/lfnovo/open-notebook | 🌐 官网 :https://www.open-notebook.ai | 💬 Discord :加入社区讨论
本文基于 Open Notebook v1.9.0 版本及 GitHub 公开信息撰写 | 最后更新:2026 年 6 月