什么是 Elasticsearch 倒排索引

Elasticsearch 倒排索引

核心定义

倒排索引是 ES 底层核心数据结构,作用是根据关键词快速找到对应文档,是 ES 检索速度快的根本原因。

对比正向索引:

  1. 正向索引 like 该文档包含哪些词
    缺点:检索要遍历全部文档,速度极慢
  2. 倒排索引:中间表 → 包含该词的所有文档ID
    优点:先查词,直接锁定文档,检索高效

示例

文档ID 文档内容
1 深入理解 Java 核心技术
2 深入理解 Java 虚拟机
3 Java 编程思想

步骤1:分词

用分词器把文本切割为最小检索单元,示例分词结果:深入、理解、Java、核心、技术、虚拟机、编程、思想

步骤2:生成倒排表

以词条为键,存储出现过该词的文档ID

词条 对应文档ID
深入 1,2
理解 1,2
Java 1,2,3
核心 1
技术 1
虚拟机 2
编程 3
思想 3

倒排索引的优势

  1. 查询速度快:直接通过词条匹配文档,无需全量扫描,这是核心
  2. 支持各类复杂检索:短语匹配、模糊查询、通配符等
  3. 聚合统计高效:方便统计词频、分组聚合
  4. 存储占用低:底层通过 VB Encoding、Simple9 等算法压缩存储

执行流程大致意思

  1. 检索关键词:Java
    流程:查询倒排表词条Java → 获取文档 1、2、3
  2. 检索关键词:虚拟机
    流程:查询倒排表词条虚拟机 → 获取文档 2
相关推荐
腾讯位置服务2 小时前
4月产品上新|魔方洞察、智能选址、打车服务三大Skills上线,两轮车熄屏导航同步升级!
大数据·开发·skill·龙虾·腾讯位置服务
金融RPA机器人丨实在智能2 小时前
工程单据Agent采购避坑:无节点追踪产品如何利用实在Agent实现溯源追责?
大数据·人工智能·ai
iiiiyu2 小时前
IO流相关编程题
java·大数据·开发语言·数据结构·数据库·mysql
cy_cy0022 小时前
创意MG动画制作,提升展厅吸引力与信息记忆度
大数据·科技·人机交互·交互·软件构建
ZKNOW甄知科技2 小时前
燕千云AI-ITR系列:三线分层机制的标准化解决方案
大数据·运维·人工智能·低代码·自然语言处理·自动化·敏捷流程
是店小二呀2 小时前
零门槛快速接入主流大模型:基于 AI Ping 平台一键集成 GLM-5.1 与多场景应用深度实战
大数据·数据库·人工智能
YangYang9YangYan2 小时前
2026学习数据分析对报考大数据专业的价值
大数据·学习·数据分析
oort1233 小时前
AI+基层治理·智慧政务解决方案——AI民意速办智能助手
大数据·人工智能·算法·政务
逐米时代3 小时前
为什么制造型企业需要企业知识库建设?
大数据·人工智能