Elasticsearch 中批量更新文档(Update By Query)的标准写法

1. 准备阶段:确定目标和条件

复制代码
UpdateByQueryRequest updateByQueryRequest = new UpdateByQueryRequest(ArchivesGlobalConstant.PROFILE_INDEX_NAME);
updateByQueryRequest.setDocTypes(ArchivesGlobalConstant.TYPE_NAME);
updateByQueryRequest.setQuery(QueryBuilders.termsQuery("lib_id", libIds));
  • 创建请求对象new UpdateByQueryRequest(...)
    • 意义 :告诉 ES,"我要对 PROFILE_INDEX_NAME 这个索引执行批量更新操作"。
  • 设置类型setDocTypes(...)
    • 意义:限定操作的文档类型(虽然新版 ES 逐渐弱化类型,但旧版客户端代码里还需要写)。
  • 设置查询条件setQuery(...)
    • 意义"找谁?" 。使用 termsQuery 找出所有 lib_idlibIds 列表中的文档。这一步和查数据是一模一样的。

2. 逻辑阶段:定义修改规则(核心)

复制代码
Map<String, Object> params = Maps.newHashMap();
params.put("groupId", groupId);
params.put("groupIds", Lists.newArrayList(groupId));

// ... 中间根据 ADD/REMOVE 选择脚本
updateByQueryRequest.setScript(new Script(...));
  • 准备参数params
    • 意义 :把 Java 里的变量(groupId)包装成 Map,准备传给 ES。这样做的目的是为了防止字符串拼接错误,也方便 ES 做安全检查。
  • 定义脚本new Script(...)
    • 意义"改成什么样?"。这是批量更新的灵魂。
    • 逻辑:把刚才的参数、脚本语言(Painless)、以及具体的修改代码(那个长字符串)组装在一起。
    • 注意 :这里根据 operateTag 判断是执行"添加 ID"还是"删除 ID"的逻辑。

3. 执行阶段:发送指令并处理

复制代码
updateByQueryRequest.setRefresh(true);
updateByQueryRequest.setConflicts("proceed");

try {
    restHighLevelClient.updateByQuery(updateByQueryRequest, RequestOptions.DEFAULT);
} catch (IOException e) {
    // 错误处理
}
  • 配置选项
    • setRefresh(true)立即生效。更新完马上刷新索引,让数据能立刻被搜索到(如果不设,ES 可能会为了性能稍后才刷新,导致查不到刚改的数据)。
    • setConflicts("proceed")冲突忽略。如果在更新过程中有其他人在修改同一条数据,不要报错停止,而是继续执行下去。
  • 发送请求client.updateByQuery(...)
    • 意义:把请求发给 ES。ES 会根据条件找到文档,然后执行脚本里的逻辑,最后保存。
相关推荐
GIS数据转换器1 小时前
延凡城市生命线系统
大数据·人工智能·信息可视化·数据挖掘·无人机
运维行者_2 小时前
网络监控方案从零开始 -- 企业级完整指南
大数据·运维·服务器·网络·数据库·人工智能·自动化
l1t2 小时前
四种python工具包用SQL查询csv和parquet文件的方法比较
大数据·python·sql
weixin_505154464 小时前
博维数孪创新引领,3D作业指导助力制造业升级
大数据·人工智能·3d·数字孪生·数据可视化·产品交互展示
LONGZETECH6 小时前
新能源汽车维护仿真软件技术架构解析+ 教学落地实操
大数据·c语言·人工智能·架构·汽车·汽车仿真教学软件·汽车教学软件
武子康7 小时前
大数据-250 离线数仓 - 电商分析 Hive 数仓 ADS 层订单分析实战:全国/大区/城市分类汇总与 Airflow 调度
大数据·后端·apache hive
QYR_Jodie7 小时前
半导体与新能源电子驱动,稳增前行:全球激光焊锡机2026-2032年CAGR4.7%,2032年锚定1.32亿美元
大数据·市场报告
SelectDB8 小时前
PostgreSQL + Apache Doris:构建用于实时分析的 HTAP 架构
大数据·数据库·数据分析
Yeats_Liao8 小时前
OpenClaw(二):配置教程
大数据·网络·人工智能·深度学习·机器学习
杰建云1678 小时前
外贸网站如何影响询盘转化率
大数据