SurfSense开源程序是NotebookLM / Perplexity / Glean的开源替代品,连接到外部来源,如搜索引擎

​一、软件介绍

文末提供程序和源码下载

虽然 NotebookLM 和 Perplexity 等工具令人印象深刻,并且对于对任何主题/查询进行研究都非常有效,但 SurfSense 通过与你的个人知识库集成来提升这种能力。它是一个高度可定制的 AI 研究代理,连接到外部资源,例如搜索引擎(Tavily、LinkUp)、Slack、Linear、Notion、YouTube、GitHub 等。

二、主要特点

1. Latest 1. 最新

💡 Idea: 💡 想法:

Have your own highly customizable private NotebookLM and Perplexity integrated with external sources.
拥有您自己的高度可定制的私有 NotebookLM 和 Perplexity 与外部源集成。

📁 Multiple File Format Uploading Support

📁 支持多种文件格式上传

Save content from your own personal files (Documents, images and supports 27 file extensions) to your own personal knowledge base .
将您自己的个人文件(文档、图像和支持 27 个文件扩展名)中的内容保存到您自己的个人知识库中。

Quickly research or find anything in your saved content .
快速研究或查找您保存的内容中的任何内容。

💬 Chat with your Saved Content

💬 与您保存的内容聊天

Interact in Natural Language and get cited answers.
在 Natural Language 中互动并获得引用的答案。

📄 Cited Answers 📄 引用的答案

Get Cited answers just like Perplexity.
获取 Perfasciity 的 Cited 答案。

🔔 Privacy & Local LLM Support

🔔 隐私和本地LLM支持

Works Flawlessly with Ollama local LLMs.
与 Ollama local LLMs完美配合。

🏠 Self Hostable 🏠 自托管

Open source and easy to deploy locally.
开源且易于本地部署。

📊 Advanced RAG Techniques

📊 高级 RAG 技术

  • Supports 150+ LLM's 支持 150+ LLM个
  • Supports 6000+ Embedding Models.
    支持 6000+ 嵌入模型。
  • Supports all major Rerankers (Pinecode, Cohere, Flashrank etc)
    支持所有主要的 Reranker(Pinecode、Cohere、Flashrank 等)
  • Uses Hierarchical Indices (2 tiered RAG setup).
    使用 Hierarchical Indices (2 层 RAG 设置)。
  • Utilizes Hybrid Search (Semantic + Full Text Search combined with Reciprocal Rank Fusion).
    利用混合搜索(语义 + 全文搜索与倒数秩融合相结合)。
  • RAG as a Service API Backend.
    RAG 即服务 API 后端。
ℹ️ External Sources i️ 外部源
  • Search Engines (Tavily, LinkUp)
    搜索引擎 (Tavily, LinkUp)
  • Slack 松弛
  • Linear 线性
  • Notion 概念
  • Youtube Videos Youtube 视频
  • GitHub GitHub的
Cross Browser Extension

🔖 跨浏览器扩展

  • The SurfSense extension can be used to save any webpage you like.
    SurfSense 扩展程序可用于保存您喜欢的任何网页。
  • Its main usecase is to save any webpages protected beyond authentication.
    它的主要用例是保存任何在身份验证之外受保护的网页。

Tech Stack 技术栈

BackEnd 后端

  • FastAPI : Modern, fast web framework for building APIs with Python

    FastAPI:用于使用 Python 构建 API 的现代、快速的 Web 框架

  • PostgreSQL with pgvector : Database with vector search capabilities for similarity searches

    带有 pgvector 的 PostgreSQL:具有用于相似性搜索的向量搜索功能的数据库

  • SQLAlchemy : SQL toolkit and ORM (Object-Relational Mapping) for database interactions

    SQLAlchemy:用于数据库交互的 SQL 工具包和 ORM(对象关系映射)

  • Alembic : A database migrations tool for SQLAlchemy.

    Alembic:用于 SQLAlchemy 的数据库迁移工具。

  • FastAPI Users : Authentication and user management with JWT and OAuth support

    FastAPI 用户:使用 JWT 和 OAuth 支持进行身份验证和用户管理

  • LangGraph : Framework for developing AI-agents.

    LangGraph:开发 AI 代理的框架。

  • LangChain : Framework for developing AI-powered applications.

    LangChain:用于开发 AI 驱动的应用程序的框架。

  • LLM Integration : Integration with LLM models through LiteLLM

    LLM集成:通过 LiteLLM 与LLM模型集成

  • Rerankers : Advanced result ranking for improved search relevance

    Rerankers:用于提高搜索相关性的高级结果排名

  • Hybrid Search : Combines vector similarity and full-text search for optimal results using Reciprocal Rank Fusion (RRF)

    混合搜索:使用倒数秩融合 (RRF) 将向量相似性和全文搜索相结合,以获得最佳结果

  • Vector Embeddings : Document and text embeddings for semantic search

    向量嵌入:用于语义搜索的文档和文本嵌入

  • pgvector : PostgreSQL extension for efficient vector similarity operations

    pgvector:用于高效向量相似性作的 PostgreSQL 扩展

  • Chonkie : Advanced document chunking and embedding library

    Chonkie:高级文档分块和嵌入库

  • Uses AutoEmbeddings for flexible embedding model selection

    用于 AutoEmbeddings 灵活的嵌入模型选择

  • LateChunker for optimized document chunking based on embedding model's max sequence length
    LateChunker 用于基于嵌入模型的最大序列长度优化文档分块


FrontEnd 前端

  • Next.js 15.2.3 : React framework featuring App Router, server components, automatic code-splitting, and optimized rendering.

    Next.js 15.2.3:React 框架,具有 App Router、服务器组件、自动代码拆分和优化渲染。

  • React 19.0.0 : JavaScript library for building user interfaces.

    React 19.0.0:用于构建用户界面的 JavaScript 库。

  • TypeScript : Static type-checking for JavaScript, enhancing code quality and developer experience.

    TypeScript:JavaScript 的静态类型检查,可增强代码质量和开发人员体验。

  • Vercel AI SDK Kit UI Stream Protocol : To create scalable chat UI.

    Vercel AI SDK 套件 UI 流协议:创建可扩展的聊天 UI。

  • Tailwind CSS 4.x : Utility-first CSS framework for building custom UI designs.

    Tailwind CSS 4.x:用于构建自定义 UI 设计的实用优先 CSS 框架。

  • Shadcn : Headless components library.

    Shadcn:Headless 组件库。

  • Lucide React : Icon set implemented as React components.

    Lucide React:作为 React 组件实现的图标集。

  • Framer Motion : Animation library for React.

    Framer Motion:React 的动画库。

  • Sonner : Toast notification library.

    Sonner:Toast 通知库。

  • Geist : Font family from Vercel.

    Geist:来自 Vercel 的字体系列。

  • React Hook Form : Form state management and validation.

    React Hook Form:表单状态管理和验证。

  • Zod : TypeScript-first schema validation with static type inference.

    Zod:使用静态类型推理进行 TypeScript 优先模式验证。

  • @hookform/resolvers : Resolvers for using validation libraries with React Hook Form.

    @hookform/resolvers: 用于将验证库与 React Hook Form 一起使用的解析器。

  • @tanstack/react-table : Headless UI for building powerful tables & datagrids.

    @tanstack/react-table:用于构建强大表格和数据网格的无头用户界面。

Extension 外延

Manifest v3 on Plasmo
Plasmo 上的 Manifest v3

三、软件下载

夸克网盘分享

本文信息来源于GitHub作者地址:GitHub - MODSetter/SurfSense: Open Source Alternative to NotebookLM / Perplexity / Glean, connected to external sources such as search engines (Tavily, Linkup), Slack, Linear, Notion, YouTube, GitHub and more.

相关推荐
孔令飞8 分钟前
如何从GitHub上调研优秀的开源项目,并魔改应用于工作中?
ai·云原生·golang·kubernetes·开源·github
新加坡内哥谈技术42 分钟前
谷歌最新推出的Gemini 2.5 Flash人工智能模型因其安全性能相较前代产品出现下滑
人工智能
搏博1 小时前
神经网络在专家系统中的应用:从符号逻辑到连接主义的融合创新
人工智能·深度学习·神经网络·算法·机器学习
Eric.Lee20211 小时前
数据集-目标检测系列- 印度人脸 检测数据集 indian face >> DataBall
人工智能·算法·目标检测·计算机视觉·yolo检测·印度人脸检测
CHNMSCS1 小时前
PyTorch_点积运算
人工智能·pytorch·python
leeseean891 小时前
使用AI 将文本转成视频 工具 介绍
人工智能·音视频
缘友一世1 小时前
深度学习系统学习系列【1】之基本知识
人工智能·深度学习·学习
feng995202 小时前
从巴别塔到通天塔:Manus AI 如何重构多语言手写识别的智能版图
大数据·人工智能·机器学习
Echo``2 小时前
19:常见的Halcon数据格式
java·linux·图像处理·人工智能·windows·机器学习·视觉检测
白熊1882 小时前
【计算机视觉】3d人体重建:PIFu/PIFuHD:高精度三维人体数字化技术指南
人工智能·计算机视觉·3d