Elasticsearch中脚本(script)的使用

Elasticsearch中脚本的使用

​ Elasticsearch支持多种脚本语言。在 ES 中,脚本语言主要是 Painless,这是 Elasticsearch 自家开发的一种安全、高效并且易于学习的语言。除了 Painless,Elasticsearch 也支持其他几种脚本语言,如 Lucene 的表达式语言,但 Painless 是推荐和默认的选项。

以下是一些常见的使用脚本的场景:

  1. 计算字段:你可以使用脚本在查询时动态地改变或添加字段的值。
  2. 脚本查询:在查询中使用脚本进行复杂的条件判断。
  3. 脚本聚合:使用脚本进行更复杂的聚合计算。

使用脚本时需要注意的是,由于涉及到运行时的计算,过度或者不恰当的使用脚本可能会对性能造成影响。另外,由于脚本具有执行任意代码的能力,因此需要确保脚本的使用在一个安全的环境中,并且只运行信任的脚本。

1、script格式

语法都遵循相同的模式

json 复制代码
"script": {
    "lang":   "...",  
    "source" | "id": "...", 
    "params": { ... } 
  }
  • lang:指定编程语言,默认是painless,还有其他编程语言选项如expression
  • source | id: source,id二者选其一,source后面接inline脚本(就是将脚本逻辑直接放在DSL里面 ),id对应一个stored脚本(就是预先设置类似UDF,使用的时候根据UDF的id进行调用和传参
  • params:在脚本中任何有名字的参数,用params传参

2、访问文档字段和特殊变量

根据脚本的使用位置,它将有权访问某些特殊变量和文档字段。

更新 (update)中使用的脚本, 查询更新 (update_by_query),或重新索引 (reindex)API将有权访问ctx变量,该变量公开

  • ctx._source ====> 访问文档_source字段。
  • ctx.op ====> 应应用于文档的操作:indexdelete
  • ctx._index等 ===> 访问文档元数据字段,其中一些可能是只读的。

使用script脚本修改某文档的某个字段,先插入一条文档

3、示例

使用script修改一个字段:

json 复制代码
//新增一条数据
PUT my-index-000001/_doc/3?refresh
{
  "first_name": "Barry",
  "last_name": "寒"
}

//script修改一个字段
POST my-index-000001/_update/3
{
  "script": {
    "source": "ctx._source.first_name= '傲'"
  }
}

//或者
POST my-index-000001/_update/3
{
  "script": {
    "source": "ctx._source['first_name']= '不吃肥肉'"
  }
}

script脚本更新字段、除了直接使用=赋值修改的情况,还可以对字段使用函数处理数值运算,比如加减乘除开方等等

json 复制代码
//将所有 '信息信息' 字符替换为 '信息'
POST my-index-000001/_update_by_query
{
  "script": {
    "source": "ctx._source.first_name = ctx._source.first_name.replace('信息信息','信息')"
  },
  "query": {
    "match_all": {}
  }
}
json 复制代码
//新增一条数据
PUT my-index-000001/_doc/4?refresh
{
  "first_name": "傲",
  "last_name": "寒",
  "tags":["java"]
}

//使用函数 新增一个tags 'pgsql'
POST my-index-000001/_update/4
{
  "script": {
    "source": "ctx._source.tags.add('pgsql')"
  }
}


// ctx.op文档操作 删除 id为4的数据
POST my-index-000001/_update/4
{
  "script": {
    "lang": "painless",
    "source": "ctx.op='delete'"
  }
}

script中的查询

json 复制代码
GET /my-index-000001/_search
{
  "script_fields": {
    "full_name": {
      "script": {
        "source": "params._source.first_name + '' + params._source.last_name"
      }
    }
  }
}

script在聚合中使用

json 复制代码
GET /my-index-000001/_search
{
 "query": {
   "match_all": {}
 },
 "aggs": {
   "full_name": {
     "terms": {
       "script": {
         "source": "params._source.first_name + '' + params._source.last_name"
       }
     }
   }
 }
}
相关推荐
葫芦和十三42 分钟前
图解 MongoDB 23|两地三中心:跨可用区部署怎么扛机房故障
后端·mongodb·agent
勇哥java实战分享3 小时前
PaddleOCR 太慢?我换成 RapidOCR 后,速度直接起飞
后端
苏三说技术7 小时前
LangChain4j 和 LangGraph4j,哪个更好?
后端
ServBay8 小时前
7 个AI开发中真正用得上的 MCP Server,配合Claude Code食用效果更佳
后端·claude·mcp
妙码生花8 小时前
从 PHP 到 AI + Golang,程序员自救转型手记(十五):优化细节、网络请求封装
前端·后端·ai编程
用户6757049885029 小时前
Go 语言里判断字符串为空,90% 的人都写错了!
后端·go
用户6757049885029 小时前
Go 进阶必修:90% 的人都没用对的“表驱动法”
后端·go
小兔崽子去哪了9 小时前
Java 生成二维码解决方案
java·后端
苍何9 小时前
懂事的 Agent 已经开始自己看屏幕干活了,效率起飞!
后端