开源语音 RAG 助手!用自然语音实时搜索向量数据库,革新语音交互体验!

传统的向量数据库搜索往往需要编写查询代码或手动输入关键词,对于非技术用户来说门槛较高。

而现在随着 AI 的进步,大家可以直接用语音对话搜索你的知识库,而无需手动输入关键词。

这不仅提升了查询效率,还能让 AI 理解你的问题语境,提供更精准的回答。

今天的主角:Oliva,正是这样一款可以通过自然语音实现对 Qdrant 向量数据库实时搜索的开源工具。

它是由 Deluxer 团队开发并在 GitHub 上开源的语音 RAG 助手。能实时处理你的语音指令,从 Qdrant 数据库中检索信息并生成回答。

无论是产品搜索、知识查询还是数据分析,它都能以自然、直观的方式提升效率。现在,这款工具已在 GitHub 开源,任何人都可以免费体验或改进它。

Oliva 背景

传统 RAG 技术主要基于文本搜索,虽然已经大幅提升 AI 的知识检索能力,但在实际应用中仍存在输入门槛高、交互不够自然、查询效率受限等问题。

而 Oliva 通过语音驱动 RAG,让 AI 具备更自然的人机交互、实时信息检索、智能化任务协作等优势。

主要功能

  • 实时语音搜索:用自然语音提问,AI 实时响应

  • 多智能体协作:采用 Langchain 多智能体架构,可将复杂问题拆解成多个子任务

  • 向量搜索优化:基于 Qdrant 向量数据库,支持语义搜索

  • 灵活集成:可连接本地或云端知识库

同时 Oliva 允许用户将 本地文档、API 数据源、在线网页 等作为 AI 的知识库,支持个性化配置。

Oliva 集成了 Deepgram(语音转文本)和 LiveKit(实时语音通信),将用户的自然语言指令转化为对向量数据库的查询,最终返回结构化结果。

快速使用

Oliva 是由Python语言开发实现的,目前仅支持本地部署。

首先,把项目克隆到本地

bash 复制代码
git clone https://github.com/Deluxer/oliva.git
cd oliva

再执行下面的命令,自动创建虚拟环境,安装依赖项

bash 复制代码
uv sync

该工具,依赖 Livekit 账户,先注册登录,拿到APIKEY、APISECRET,配置环境变量

ini 复制代码
# 注册登录 
# https://cloud.livekit.io

cp .env.example .env

LIVEKIT_URL=wss://your-project.livekit.cloud
LIVEKIT_API_KEY=secret
LIVEKIT_API_SECRET=********

使用Docker运行Qdrant,在想要的地方设置API密钥:

bash 复制代码
docker run -p 6333:6333 -p 6334:6334 \
    -e QDRANT__SERVICE__API_KEY=******** \
    -v "$(pwd)/qdrant_storage:/qdrant/storage:z" \
    qdrant/qdrant

启动语音助手

go 复制代码
make oliva-start

适用场景

  • 知识库搜索:企业内部文档、FAQ、技术手册等。

  • 智能客服:支持语音交互的 AI 客服助手。

  • 语音驱动 AI 应用:智能家居、移动端 AI 语音助手等。

写在最后

Oliva 通过语音搜索 + RAG + 多智能体协作,让 AI 交互更加自然、智能和高效。

自然语言搜索,门槛低到极致;多智能体协作,响应快且精准;LangChain 和 Superlinked 强强联合。

它不仅提升了信息检索的体验,还能帮助开发者搭建更加个性化的 AI 语音助手。

GitHub 项目地址: github.com/Deluxer/oli...

相关推荐
天衍四九5 小时前
Git从0到实战(四):冲突解决与版本回退 —— 别怕,出错了也能救
github
大刚测试开发实战6 小时前
如何内网穿透访问本地私有化部署的TestHub
前端·后端·github
uhakadotcom1 天前
在python 的 工程化架构中 ,什么是 薄包装器层?
后端·面试·github
Avan_菜菜2 天前
AI 能写代码了,为什么我反而开始要求它先写文档?
前端·github·ai编程
逛逛GitHub2 天前
这个爆红的 GitHub 项目让 token 直接省 60–95%。
github
iccb10132 天前
5年,一个程序员是如何把私有化在线客服系统做到第一名的
前端·后端·github
蝎子莱莱爱打怪2 天前
AI Agent 相关知识扫盲:16 个概念+11张图+38个开源项目推荐
人工智能·github·agent
用户317723070362 天前
Pydub:用 Python 处理音频,不写废话
github
张居邪2 天前
GitHub Actions + 阿里云 OSS:OIDC 免密同步构建产物
后端·github
张居斜3 天前
GitHub Actions + 阿里云 OSS:OIDC 免密同步构建产物
github·oss·llm-wiki