企业搜索基础设施的建设,正在从单一的全文检索向多元化方向演进。日志分析、实时监控、向量检索、AI 问答------不同场景对底层能力的要求各有侧重,但对统一管理和高效运维的诉求是一致的。本文介绍极限科技(INFINI Labs)的产品体系,探讨如何构建一套完整的企业级搜索基础设施。
产品架构
极限科技的产品矩阵覆盖搜索场景的各个层面:
下面逐一介绍各产品的定位与核心能力。
Easysearch:分布式搜索引擎
Easysearch 是整个产品体系的基座,提供数据存储与检索的核心能力:
- 全文检索:支持中文分词、拼音搜索、同义词扩展
- 向量检索:支持高维向量的近似最近邻搜索,适用于语义检索、图像搜索等场景
- 聚合分析:支持多维度的数据聚合与统计分析
- 分布式架构:支持水平扩展,数据自动分片与副本
Easysearch 兼容 Elasticsearch API,现有基于 Elasticsearch 的应用可以平滑迁移。
Gateway:搜索网关
Gateway 位于应用与搜索引擎之间,承担流量治理的核心职责:
- 统一接入:为多集群提供单一访问入口,简化客户端配置
- 负载均衡:支持多种负载均衡策略,智能分发请求
- 安全管控:认证授权、访问控制、敏感数据脱敏、异常请求拦截
- 流量保护:限流、熔断、降级,保护后端集群免受流量冲击
- 查询改写:支持查询语句的动态改写与优化
- 结果缓存:热点查询缓存,降低后端压力
应用 Gateway Easysearch 集群 Easysearch 集群-备
Console:统一管控平台
Console 提供可视化的管控界面,是日常运维的核心工具:
- 多集群纳管:统一管理多个 Easysearch 或 Elasticsearch 集群
- 集群监控:节点状态、索引状态、查询性能等指标的实时监控
- 告警管理:灵活的告警规则配置,支持多种通知渠道
- 索引管理:索引生命周期管理、索引模板、别名管理
- 数据迁移:跨集群数据迁移与同步
- 安全审计:操作日志记录与审计
Coco AI:AI 搜索助手
Coco AI 是面向 AI 场景的上层应用,基于 RAG(检索增强生成)架构:
- 数据连接:支持对接文档、数据库、网页等多种数据源
- 文档处理:自动完成文档解析、切片、向量化
- 混合检索:结合关键词检索与向量检索,提升召回效果
- 智能问答:基于检索结果生成自然语言回答
- 对话管理:支持多轮对话,上下文理解
Coco AI 底层依赖 Easysearch 的向量存储与检索能力,可对接主流大模型。
Loadgen:性能测试工具
Loadgen 用于搜索架构的性能基准测试与压力测试:
- 场景模拟:支持自定义查询模板,模拟真实业务场景
- 性能指标:吞吐量、响应延迟、百分位延迟等指标统计
- 压力测试:支持逐步加压,定位系统瓶颈
- 对比测试:不同配置、不同版本的性能对比
- 报告生成:自动生成测试报告
产品协同
各产品之间并非孤立存在,而是相互配合,形成完整的解决方案。
引擎层 管理层 应用层 性能测试 性能测试 监控管理 监控管理 Easysearch Console Gateway Loadgen Coco AI 业务应用 COCO
Gateway + Easysearch:Gateway 作为 Easysearch 的前置代理,提供流量治理能力。多个 Easysearch 集群可以通过 Gateway 统一对外提供服务,实现读写分离、故障切换等高级特性。
Console + 全部组件:Console 作为统一管控平台,可以纳管 Easysearch 集群、配置 Gateway 路由规则、查看各组件的运行状态。运维人员通过 Console 即可完成日常管理工作。
Coco AI + Easysearch:Coco AI 利用 Easysearch 的向量检索能力存储文档向量,检索相关文档后交由大模型生成回答。两者配合实现企业级的智能问答能力。
Loadgen + Easysearch/Gateway:在系统上线前或扩容前,使用 Loadgen 进行性能测试,验证系统是否满足业务需求,为容量规划提供数据支撑。
场景方案
场景一:日志分析平台
数据采集 Logstash Filebeat Gateway Easysearch Console
采用社区采集工具(如 Logstash、Filebeat)完成日志采集,Gateway 负责接入与流量控制,Easysearch 承载存储与检索,Console 提供集群监控与索引生命周期管理。
这套方案适用于运维日志、应用日志、安全日志等场景,支持 PB 级数据存储与秒级查询响应。
场景二:企业知识库问答
数据源 文档系统 知识库 数据库 Coco AI COCO Easysearch 大模型 用户
Coco AI 对接企业内部的文档系统、知识库、数据库等数据源,自动完成文档解析与向量化。用户提问时,系统检索相关文档片段,结合大模型生成准确的回答。
这套方案适用于内部知识库问答、客服机器人、智能助手等场景。
场景三:电商搜索服务
压测 搜索应用 Gateway Easysearch-主 Easysearch-从 Console Loadgen
Gateway 实现负载均衡与读写分离,主从架构保障高可用。Console 监控查询性能,分析慢查询,优化搜索体验。Loadgen 定期进行性能测试,确保大促期间系统稳定。
这套方案适用于商品搜索、内容搜索等对性能和可用性要求较高的场景。
场景四:跨数据中心容灾
数据中心 B 数据中心 A 数据同步 统一管理 统一管理 Easysearch Gateway Easysearch Gateway 应用 负载均衡 Console
两个数据中心各部署一套 Easysearch 集群,通过 Console 配置跨集群数据同步。Gateway 实现就近接入与故障切换,当一个数据中心故障时,流量自动切换到另一个数据中心。
这套方案适用于对数据安全和业务连续性要求较高的金融、政务等场景。
技术优势
产品完整性:从存储引擎(Easysearch)到流量管理(Gateway),从运维管理(Console)到性能测试(Loadgen),再到 AI 应用(Coco AI),覆盖搜索场景核心链路。
深度集成:各产品之间深度集成,统一的配置管理、监控体系、安全机制,开箱即用,无需额外的集成开发。
生态兼容:Easysearch 兼容 Elasticsearch API,现有的 Kibana、Logstash、Filebeat 等工具可以直接使用,迁移成本可控。
资源效率:产品设计追求轻量化,相比同类产品资源占用更低,尤其适合资源受限的环境。
自主可控:全线产品自主研发,代码可控,满足国产化替代与信创要求。
选型参考
| 场景 | 推荐组合 |
|---|---|
| 日志分析 | Easysearch + Gateway + Console |
| 全文检索 | Easysearch + Gateway + Console |
| AI 问答 | Coco AI + Easysearch |
| 性能测试 | Loadgen |
| 跨数据中心容灾 | Easysearch + Gateway + Console |
| 国产化替代 | 全产品线 |
结语
搜索基础设施的建设需要兼顾功能完备性、运维便捷性与长期演进能力。极限科技的产品体系提供了一套经过生产验证的技术方案,适用于日志分析、全文检索、AI 问答、容灾备份等多种场景。对于正在规划搜索基础设施建设或国产化替代的企业,这套产品体系值得纳入评估范围。
更多信息请访问:https://infinilabs.cn