Python 同时适配 Elasticsearch 与 Easysearch 实战复盘

unsetunset一、背景与目标unsetunset

需要在同一个 Python 项目中同时支持:

  1. Elasticsearch 8.x / 9.x

Text2DSL------自然语言转 Elasticsearch / Easysearch DSL 神器

  1. Easysearch极限科技,ES 兼容)

用户在前端选择搜索引擎后,后端要能正确连接并执行 DSL,且要处理 HTTPS 自签名证书等常见问题。

unsetunset二、核心结论(先给结论)unsetunset

方案 适用场景 优缺点
elasticsearch 7.13.1 同时连 ES 和 Easysearch 无产品校验,兼容性好,需 NumPy 2.0 兼容补丁
elasticsearch 8.x/9.x 仅连接官方 Elasticsearch 有产品校验,会拒绝 Easysearch
opensearch-py 仅连 Easysearch/OpenSearch 需多一个依赖,增加复杂度

推荐做法

使用 elasticsearch==7.13.1 作为唯一客户端,可同时连接 Elasticsearch 8.x/9.x 和 Easysearch。

unsetunset三、问题拆解unsetunset

3.1 产品兼容性校验

elasticsearch-py 7.14 起,客户端会校验服务端是否为"官方 Elasticsearch",连接 Easysearch、OpenSearch 等会抛出类似:

go 复制代码
UnsupportedProductError / "The client noticed that the server is not a supported distribution of Elasticsearch"
  • 7.13.1:没有该校验,可连接任意 ES 兼容服务

  • 8.x:校验更严格,只认官方 Elasticsearch

官方文档明确说明:

https://elasticsearch-py.readthedocs.io/en/7.x/transports.html

所以若希望同一套代码同时支持 ES 和 Easysearch,应锁定到 7.13.1

3.2 NumPy 2.0 兼容

NumPy 2.0 移除了 np.float_np.int_,而 elasticsearch 7.13 仍在使用,需要在导入 elasticsearch 之前做兼容:

go 复制代码
import numpy as _np
if not hasattr(_np, "float_"):
    _np.float_ = _np.float64
if not hasattr(_np, "int_"):
    _np.int_ = _np.int64
from elasticsearch import Elasticsearch

这样在 NumPy 2.0 下也能正常使用。

3.3 HTTPS 自签名证书

使用 HTTPS 且证书自签名时,常见错误:

go 复制代码
SSLError: certificate verify failed: self-signed certificate in certificate chain

处理方式:在创建客户端时关闭证书校验(仅适合内网 / 自建环境):

go 复制代码
kwargs = {
    "hosts": [{"host": host, "port": port, "scheme": scheme}],
    "timeout": 30,
    "max_retries": 3,
    "retry_on_timeout": True,
}
if scheme == "https"andnot verify_certs:
    kwargs["verify_certs"] = False
# 如 7.x 的默认 Transport 仍报错,可改用 RequestsHttpConnection
from elasticsearch import RequestsHttpConnection
client = Elasticsearch(
    hosts=hosts,
    connection_class=RequestsHttpConnection,
    http_auth=http_auth,
    use_ssl=True,
    verify_certs=False,
    timeout=30,
)

并配合 urllib3.disable_warnings() 抑制 SSL 告警。

3.4 依赖约束

go 复制代码
elasticsearch==7.13.1
numpy<2   # 若使用 NumPy 2.0,则需上面的补丁
requests>=2.26.0

unsetunset四、我们走过的几种方案unsetunset

方案 A:双客户端(ES 8.x + opensearch-py)

  • Elasticsearch:使用 elasticsearch>=8

  • Easysearch:使用 opensearch-py

问题:两个包、两套 API、分支多,维护成本高,我也明确不希望引入 opensearch。

方案 B:单客户端 8.x + 禁用产品校验

尝试在 8.x 中通过自定义 Transport 或 monkey-patch 禁用产品校验。

问题:依赖非官方实现,升级风险大,不够稳妥。

方案 C:单客户端 7.13.1(最终采用)

  • 固定使用 elasticsearch==7.13.1

  • 同时连接 Elasticsearch 8.x / 9.x 和 Easysearch

  • 无产品校验,API 稳定,依赖简单

结论:方案 C 最符合当前需求。

unsetunset五、示例:统一的客户端创建逻辑unsetunset

go 复制代码
# 1. NumPy 兼容(若使用 NumPy 2.0)
import numpy as _np
ifnot hasattr(_np, "float_"):
    _np.float_ = _np.float64
ifnot hasattr(_np, "int_"):
    _np.int_ = _np.int64

from elasticsearch import Elasticsearch
from elasticsearch.helpers import bulk as helpers_bulk

def create_es_client(host, port, scheme="http", http_auth=None, verify_certs=True):
    hosts = [{"host": host, "port": port, "scheme": scheme}]
    kwargs = {
        "hosts": hosts,
        "timeout": 30,
        "max_retries": 3,
        "retry_on_timeout": True,
    }
    if http_auth:
        kwargs["http_auth"] = http_auth
    if scheme == "https"andnot verify_certs:
        kwargs["verify_certs"] = False

    try:
        client = Elasticsearch(**kwargs)
    except TypeError:
        # 某些 7.x 版本参数不同
        kwargs.pop("verify_certs", None)
        from elasticsearch import RequestsHttpConnection
        import urllib3
        urllib3.disable_warnings()
        client = Elasticsearch(
            hosts=hosts,
            connection_class=RequestsHttpConnection,
            http_auth=http_auth,
            use_ssl=True,
            verify_certs=False,
            timeout=30,
        )

    ifnot client.ping():
        client.info()  # 兜底
    return client

前端/配置中只需区分 product: "elasticsearch""easysearch",后端都用同一套 elasticsearch 7.13.1 客户端即可。

unsetunset六、总结unsetunset

  1. 单客户端

elasticsearch==7.13.1 可同时支持 Elasticsearch 8.x/9.x 和 Easysearch。

  1. 产品校验

7.13.1 无校验,7.14+ 会校验,这是选 7.13.1 的核心原因。

  1. NumPy

在 NumPy 2.0 下需补回 np.float_ / np.int_

  1. HTTPS

自签名证书时设置 verify_certs=False,必要时用 RequestsHttpConnection

  1. 不引入 opensearch-py

减少依赖和复杂度,保持实现简单。

如果后续需要同时使用 8.x 的新特性并支持 Easysearch,再考虑引入 opensearch-py 或按产品类型切换不同客户端会比较合适;

目前以兼容性和维护成本为主时,7.13.1 单客户端方案是更稳妥的选择。

**Text2DSL v2.0完整代码:https://t.zsxq.com/n2LB9


Text2DSL------自然语言转 Elasticsearch / Easysearch DSL 神器

基于 Easysearch + Flip 的多模态图像搜索引擎系统实战指南

Easysearch Python 客户端企业级实战------从 0 到 1 解决兼容性与连接难题

Codebuddy 实现:云端 Elasticsearch 到 本地 Easysearch 跨集群迁移 Python 小工具

用 Python 优雅地玩转 Elasticsearch:实用技巧与最佳实践


更短时间更快习得更多干货!

和全球 2100+ Elastic 爱好者一起精进!

比同事抢先一步学习进阶干货!

相关推荐
阿星AI工作室7 小时前
刘润年中大课笔记:一句话说清AI落地之战的本质
大数据·人工智能·创业创新·商业
不仙52010 小时前
VMware Workstation 26.0.0 在 Ubuntu 24.04 (内核 6.17.0) 上的安装与内核模块编译问题
linux·ubuntu·elasticsearch
1892280486111 小时前
NY352固态MT29F32T08GWLBHD6-24QJ:B
大数据·服务器·人工智能·科技·缓存
不开大的凯207711 小时前
麦当秀AiPPT战略转向:从SaaS订阅迈向Token经济,AI办公定价模式迎来新探索
大数据·人工智能
程序鉴定师11 小时前
西安小程序制作的可靠选择与发展前景
大数据·小程序
黎阳之光11 小时前
黎阳之光:以视频孪生重构智慧医院信息化,打造高标项目核心竞争力
大数据·人工智能·物联网·算法·数字孪生
qziovv12 小时前
Git 回退场景
大数据·git·elasticsearch
ZeroNews内网穿透13 小时前
面向 AI 协作的本地客户端能力:ZeroNews Agent Skills
大数据·人工智能·elasticsearch
SelectDB13 小时前
Agent 时代,为什么传统的可观测方案不适用了?
大数据·数据库·数据分析
Elastic 中国社区官方博客13 小时前
快 12 倍的 Elasticsearch 向量索引:使用 GPU 和 CPU 分层部署 NVIDIA cuVS
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索·nvidia