互联网元搜索引擎SearXNG

最近有个很火的项目叫 FreeAskInternet,其工作原理是:

  • 第一步、用户提出问题
  • 第二步、用 SearXNG(本地运行)在多个搜索引擎上进行搜索
  • 第三步、将搜索结果传入 LLM 生成答案

所有进程都在本地运行,适用于需要快速获取信息但又重视隐私保护的用户,FreeAskInternet 提供了一个便捷且安全的解决方案。

不过 FreeAskInternet 在国内使用,可能还是存在网络问题, LLM 我们可以使用 kimi-free-api 等国内产品,但是 SearXNG 的效果如何,还需要进一步测试

什么是 SearXNG ?

SearXNG 是一个免费的互联网元搜索引擎,它来自各种搜索服务和数据库的结果。用户既不被跟踪,也不会被分析。

多年前,老苏曾经写过 searX,按照常见的命名规则,NG 代表 Next Generation,即下一代,所以可以我们简单的理解为 SearXNGSearX 的分支的下一代版本,可能包含了对代码的重写、新功能的添加以及对用户体验的改进。

文章传送门:searX用处不大的个人聚合搜索引擎

安装

在群晖上以 Docker 方式安装。

推荐使用命令行方式安装

在注册表中搜索 searxng ,选择第一个 searxng/searxng,版本选择 latest

开始折腾时, latest 版本对应为 2024.3.29-f5bb64cca,本文写作时, latest 版本对应为 2024.4.8-4acb52f68

权限

勾选 使用高权限执行容器

docker 文件夹中,创建一个新文件夹 searxng,并在其中建一个子文件夹 data

文件夹 装载路径 说明
docker/searxng/data /etc/searxng 存放设置文件等

端口

本地端口不冲突就行,不确定的话可以用命令查一下

bash 复制代码
# 查看端口占用
netstat -tunlp | grep 端口号
本地端口 容器端口
8061 8080

命令行安装

如果你熟悉命令行,可能用 docker cli 更快捷

bash 复制代码
# 新建文件夹 searxng 和 子目录
mkdir -p /volume1/docker/searxng/data

# 进入 searxng 目录
cd /volume1/docker/searxng

# 运行容器
docker run -d \
  --name searxng \
  --cap-drop ALL \
  --cap-add CHOWN \
  --cap-add SETGID \
  --cap-add SETUID \
  --log-driver json-file \
  --log-opt max-size=1m \
  --log-opt max-file=1 \
  -p 8061:8080 \
  -v $(pwd)/data:/etc/searxng:rw \
  searxng/searxng:latest

也可以用 docker-compose 安装,将下面的内容保存为 docker-compose.yml 文件

yaml 复制代码
version: '3.7'

services:
  searxng:
    image: searxng/searxng:latest
    container_name: searxng
    ports:
      - 8061:8080
    volumes:
      - ./data:/etc/searxng:rw
    cap_drop:
      - ALL
    cap_add:
      - CHOWN
      - SETGID
      - SETUID
    logging:
      driver: 'json-file'
      options:
        max-size: '1m'
        max-file: '1'

然后执行下面的命令

bash 复制代码
# 新建文件夹 searxng 和 子目录
mkdir -p /volume1/docker/searxng/data

# 进入 searxng 目录
cd /volume1/docker/searxng

# 将 docker-compose.yml 放入当前目录

# 一键启动
docker-compose up -d

运行

在浏览器中输入 http://群晖IP:8061 就能看到搜索界面

先进 首选项 进行设置,任何更改都需要 保存 才能生效

调整了一下搜索引擎,挑选了几个主流的搜索引擎

【注意】:群晖必须要能访问到才行,否则是不会出搜索结果的

第一次搜 小猫照片,返回的结果第一页是 bing

刷新后,第一页都是 google

有时候,会需要多次刷新才会有搜索结果,看来老苏的网络也不太稳定

想让 Chatgpt 3.5 具备联网搜索的方法很多,譬如给 Chrome 装个 WebChatGPT 插件

所以 FreeAskInternet 就不再尝试了

参考文档

searxng/searxng: SearXNG is a free internet metasearch engine which aggregates results from various search services and databases. Users are neither tracked nor profiled.

地址:https://github.com/searxng/searxng
searxng/searxng-docker: The docker-compose files for setting up a SearXNG instance with docker.

地址:https://github.com/searxng/searxng-docker
Welcome to SearXNG --- SearXNG Documentation (2022.05.29-38403ee5)

地址:https://docs.searxng.org/
[问题]searx和searxng有什么区别? · searchxng/searxng · 讨论 #972

地址:https://github.com/searxng/searxng/discussions/972
nashsu/FreeAskInternet: FreeAskInternet is a completely free, PRIVATE and LOCALLY running search aggregator & answer generate using MULTI LLMs, without GPU needed. The user can ask a question and the system will make a multi engine search and combine the search result to LLM and generate the answer based on search results. It's all FREE to use.

地址:https://github.com/nashsu/FreeAskInternet

相关推荐
疯狂的大狗15 分钟前
docker进入正在运行的容器,exit后的比较
运维·docker·容器
长天一色29 分钟前
【Docker从入门到进阶】01.介绍 & 02.基础使用
运维·docker·容器
伊玛目的门徒30 分钟前
docker 搭建minimalist-web-notepad
运维·docker·notepad
Elastic 中国社区官方博客1 小时前
使用 Vertex AI Gemini 模型和 Elasticsearch Playground 快速创建 RAG 应用程序
大数据·人工智能·elasticsearch·搜索引擎·全文检索
theo.wu3 小时前
使用Buildpacks构建Docker镜像
运维·docker·容器
wusam12 小时前
螺蛳壳里做道场:老破机搭建的私人数据中心---Centos下Docker学习04(环境准备)
学习·docker·centos
wusam15 小时前
螺蛳壳里做道场:老破机搭建的私人数据中心---Centos下Docker学习03(网络及IP规划)
运维·服务器·网络·docker·容器
一直在进步的派大星15 小时前
Docker 从安装到实战
java·运维·docker·微服务·容器
sp_fyf_202417 小时前
[大语言模型-论文精读] 更大且更可指导的语言模型变得不那么可靠
人工智能·深度学习·神经网络·搜索引擎·语言模型·自然语言处理
丶213619 小时前
【大数据】Elasticsearch 实战应用总结
大数据·elasticsearch·搜索引擎