elasticsearch _cat/indices docs.count is different than <index>/_count

今天遇到一个问题,kibana中看到文档数与下面语句查询到的不同

bash 复制代码
GET /_cat/count/jiankunking_xxxxx_product_expand_test?v
GET /jiankunking_xxxxx_product_expand_test/_search?track_total_hits=true

语句查询结果

bash 复制代码
epoch      timestamp count
1711433785 06:16:25  508666675

kibana数据

kibana这里看到的数据与GET _cat/indices?v获取到的结果是一样的

语句

bash 复制代码
GET _cat/indices/jiankunking_xxxxx_product_expand_test?v

结果

bash 复制代码
health status index                                  uuid                   pri rep docs.count docs.deleted store.size pri.store.size
green  open   jiankunking_xxxxx_product_expand_test7BbNsDs_RVyOR1Wn4LZoDA   6   0  894203500        88097    336.8gb        336.8gb

那么到底哪个是对的呢?

在GitHub中找到了原因:https://github.com/elastic/elasticsearch/issues/25868

cat api 和 count api 之间存在差异。前者查看的是 Lucene 统计,而后者执行的是查询。Lucene 统计会考虑到已删除的文档和嵌套文档,而这两种情况都隐藏在搜索次数中。

由于jiankunking_xxxxx_product_expand_test中有多个nested属性,所以cat的数量是比count api获取到的多不少。

相关推荐
好吃的肘子9 小时前
Elasticsearch架构原理
开发语言·算法·elasticsearch·架构·jenkins
斯普信专业组11 小时前
Elasticsearch索引全生命周期管理指南之一
大数据·elasticsearch·搜索引擎
Clown9512 小时前
go-zero(十九)使用Prometheus监控ES指标
elasticsearch·golang·prometheus
数巨小码人18 小时前
Linux常见命令
大数据·linux·运维·服务器·elasticsearch·搜索引擎
就不爱吃大米饭19 小时前
Chrome代理IP配置教程常见方式附问题解答
大数据·人工智能·搜索引擎
真实的菜20 小时前
Elasticsearch 分片机制高频面试题(含参考答案)
elasticsearch·搜索引擎·es
ice___Cpu21 小时前
Git - 1( 14000 字详解 )
大数据·git·elasticsearch
tebukaopu1481 天前
官方 Elasticsearch SQL NLPChina Elasticsearch SQL
大数据·sql·elasticsearch
uyeonashi1 天前
【Boost搜索引擎】构建Boost站内搜索引擎实践
开发语言·c++·搜索引擎
jiedaodezhuti1 天前
ElasticSearch重启之后shard未分配问题的解决
笔记·elasticsearch