Elasticsearch文档_id以数组方式返回

背景需求是只需要文档的_id字段,并且_id组装成一个数组。

在搜索请求中使用 script_fields 来整理 _id 为数组输出:

json 复制代码
POST goods_info/_search?size=0
{
  "query": {
    "term": {
      "brand": {
        "value": "MGC"
      }
    }
  },
  "_source":false,
 "aggs": {
    "ids_as_array": {
      "scripted_metric": {
        "init_script": "state.ids = []",
        "map_script": "state.ids.add(doc['_id'].value)",
        "combine_script": "return state.ids",
        "reduce_script": "def ids = []; for (s in states) { ids.addAll(s) } return ids"
      }
    }
  }
  
}

代码说明:

  1. size: 0:表示不需要实际返回任何文档,因为我们只关心聚合结果。
  2. scripted_metric:一个聚合类型,允许在多个阶段中使用脚本来聚合数据。
  3. init_script:在每个分片上初始化状态。在这里,我们初始化了一个空的列表 ids。
  4. map_script:在每个文档上执行。这里,我们将文档的 _id 添加到 ids 列表中。
  5. combine_script:在每个分片上执行,用于合并每个分片的结果。在这里,我们直接返回 ids 列表。
  6. reduce_script:在所有分片结果上执行,用于合并所有分片的结果。在这里,我们将所有分片的 ids 列表合并成一个大的列表。

输出结果:

相关推荐
Elasticsearch12 小时前
通用表达式语言 ( CEL ): CEL 输入如何改进 Elastic Agent 集成中的数据收集
elasticsearch
海兰2 天前
离线合同结构化提取与检索:LangExtract + 本地DeepSeek + Elasticsearch 9.x
大数据·elasticsearch·django
yumgpkpm2 天前
AI视频生成:Wan 2.2(阿里通义万相)在华为昇腾下的部署?
人工智能·hadoop·elasticsearch·zookeeper·flink·kafka·cloudera
Sheffield3 天前
如果把ZooKeeper按字面意思比作动物园管理员……
elasticsearch·zookeeper·kafka
嗝屁小孩纸3 天前
ES索引重建(零工具纯脚本执行)
大数据·elasticsearch·搜索引擎
Elastic 中国社区官方博客3 天前
使用 Jina Embeddings v5 和 Elasticsearch 构建“与你的网站数据聊天”的 agent
大数据·人工智能·elasticsearch·搜索引擎·容器·全文检索·jina
Elastic 中国社区官方博客3 天前
Elastic 公共 roadmap 在此
大数据·elasticsearch·ai·云原生·serverless·全文检索·aws
码云数智-大飞3 天前
像写 SQL 一样搜索:dbVisitor 如何用 MyBatis 范式颠覆 ElasticSearch 开发
sql·elasticsearch·mybatis
海兰3 天前
Jina Embeddings V5 Text + Elasticsearch 9.x 本地部署指南
elasticsearch·jenkins·jina