上线一周收获2K star,仅500行代码实现AI增强搜索引擎

这个项目刚刚发布便登上GitHub热榜首位,短短一周便收获了惊人的2K star,背后的团队更是备受热议,今天的开源项目就是AI搜索引擎:lepton search

Lepton Search的一些背景

Lepton Search 是有LeptonAI 推出的 ai增强对话式搜索引擎,可以说从发布出来的那一天,就备受关注和争议。

首先要说不是产品,而是LeptonAI的CEO 贾扬清。如果是关注AI圈子的人 ,一定对这个名字不陌生了,先是贾扬清发表的朋友圈,怒喷了一把国内某些大厂的大模型抄袭,当时一度爆火。

再说回产品,在1月25日Lepton AI 发布了一个小demo,当时Lepton Search 还没有正式开源。在发布之后,号称要干掉谷歌搜索的 Perplexity 创始人声称 LeptonAI 在"借鉴"、"致敬"他们的产品。作为 LeptonAI 的创始人,贾扬清在 Twitter 上进行了公开回击,并且明确说,要开源Lepton Search 。

现在Lepton Search 正式开源后,关注度更是持续升温。

Lepton Search 是什么

贾扬清在自己的团队记录里提到,这只是一个demo,仅用了一个周末的时间来演示AI应用容易实现。以下它目前的能力:

  • 对 LLM 的内置支持
  • 内置搜索引擎支持
  • 可定制漂亮的UI界面
  • 可共享的缓存搜索结果

Lepton Search之所以500行代码就能实现,依赖的是它背后已经模块化的AI能力,这里Lepton Search之所以核心使用到的能力有3块:

  • 大模型,调用了在LeptonAI自家云上部署的开源Mixtral-8x7b模型。
  • 搜索引擎,目前用了必应搜索的API。
  • 数据存储,用自家Lepton KV作为无服务器存储。

所以Lepton Search 是一个前端UI加接口调度的组合。但是这也给所有开发者一个借鉴,未来的AI应用开发将愈来愈模块化。

使用 Lepton Search

项目提供了在线试用:

search.lepton.run/

当然也可以自己来编译部署,以下几步:

首先需要获取bing的key,设置为变量

ini 复制代码
export BING_SEARCH_V7_SUBSCRIPTION_KEY=YOUR_BING_SUBSCRIPTION_KEY

编译web

arduino 复制代码
cd web && npm install && npm run build

启动服务

ini 复制代码
BACKEND=BING python search_with_lepton.py

AI增强搜索引擎

目前,大语言模型(LLM)主要面临两大挑战:数据陈旧、偶发幻觉。由于基础模型所使用的预训练数据集具有明确的截止日期,因此无法根据最新数据做出响应。即使是当前最强大的模型,也往往会因数据过时而编造答案,也就是人们常说的"幻觉"问题。

对于无法访问最新数据,可以有两种方法,第一种是通过搜索引擎,通过执行网络搜索并向大模型提交输来改善决策质量。

第二种方法是,通过所谓检索增强生成(RAG),这项成熟技术可以解决一定程度的"幻觉"问题。与前面提到的动态调用搜索 API 方法不同,RAG 强调从公开数据存储中检索数据,例如向量数据库或者由外部维护的全文搜索索引等。

项目信息

  • 项目名称:Lepton Search
  • GitHub 链接:search_with_lepton
  • Star 数:2K+
相关推荐
霍格沃兹软件测试开发15 小时前
快速掌握Dify+Chrome MCP:打造网页操控AI助手
人工智能·chrome·dify·mcp
张子夜 iiii15 小时前
4步OpenCV-----扫秒身份证号
人工智能·python·opencv·计算机视觉
华新嘉华DTC创新营销17 小时前
华新嘉华:AI搜索优化重塑本地生活行业:智能推荐正取代“关键词匹配”
人工智能·百度·生活
SmartBrain18 小时前
DeerFlow 实践:华为IPD流程的评审智能体设计
人工智能·语言模型·架构
l1t19 小时前
利用DeepSeek实现服务器客户端模式的DuckDB原型
服务器·c语言·数据库·人工智能·postgresql·协议·duckdb
在未来等你20 小时前
Elasticsearch面试精讲 Day 17:查询性能调优实践
大数据·分布式·elasticsearch·搜索引擎·面试
寒月霜华20 小时前
机器学习-数据标注
人工智能·机器学习
九章云极AladdinEdu21 小时前
超参数自动化调优指南:Optuna vs. Ray Tune 对比评测
运维·人工智能·深度学习·ai·自动化·gpu算力
人工智能训练师1 天前
Ubuntu22.04如何安装新版本的Node.js和npm
linux·运维·前端·人工智能·ubuntu·npm·node.js
cxr8281 天前
SPARC方法论在Claude Code基于规则驱动开发中的应用
人工智能·驱动开发·claude·智能体