Elasticsearch中脚本(script)的使用

Elasticsearch中脚本的使用

​ Elasticsearch支持多种脚本语言。在 ES 中,脚本语言主要是 Painless,这是 Elasticsearch 自家开发的一种安全、高效并且易于学习的语言。除了 Painless,Elasticsearch 也支持其他几种脚本语言,如 Lucene 的表达式语言,但 Painless 是推荐和默认的选项。

以下是一些常见的使用脚本的场景:

  1. 计算字段:你可以使用脚本在查询时动态地改变或添加字段的值。
  2. 脚本查询:在查询中使用脚本进行复杂的条件判断。
  3. 脚本聚合:使用脚本进行更复杂的聚合计算。

使用脚本时需要注意的是,由于涉及到运行时的计算,过度或者不恰当的使用脚本可能会对性能造成影响。另外,由于脚本具有执行任意代码的能力,因此需要确保脚本的使用在一个安全的环境中,并且只运行信任的脚本。

1、script格式

语法都遵循相同的模式

json 复制代码
"script": {
    "lang":   "...",  
    "source" | "id": "...", 
    "params": { ... } 
  }
  • lang:指定编程语言,默认是painless,还有其他编程语言选项如expression
  • source | id: source,id二者选其一,source后面接inline脚本(就是将脚本逻辑直接放在DSL里面 ),id对应一个stored脚本(就是预先设置类似UDF,使用的时候根据UDF的id进行调用和传参
  • params:在脚本中任何有名字的参数,用params传参

2、访问文档字段和特殊变量

根据脚本的使用位置,它将有权访问某些特殊变量和文档字段。

更新 (update)中使用的脚本, 查询更新 (update_by_query),或重新索引 (reindex)API将有权访问ctx变量,该变量公开

  • ctx._source ====> 访问文档_source字段。
  • ctx.op ====> 应应用于文档的操作:indexdelete
  • ctx._index等 ===> 访问文档元数据字段,其中一些可能是只读的。

使用script脚本修改某文档的某个字段,先插入一条文档

3、示例

使用script修改一个字段:

json 复制代码
//新增一条数据
PUT my-index-000001/_doc/3?refresh
{
  "first_name": "Barry",
  "last_name": "寒"
}

//script修改一个字段
POST my-index-000001/_update/3
{
  "script": {
    "source": "ctx._source.first_name= '傲'"
  }
}

//或者
POST my-index-000001/_update/3
{
  "script": {
    "source": "ctx._source['first_name']= '不吃肥肉'"
  }
}

script脚本更新字段、除了直接使用=赋值修改的情况,还可以对字段使用函数处理数值运算,比如加减乘除开方等等

json 复制代码
//将所有 '信息信息' 字符替换为 '信息'
POST my-index-000001/_update_by_query
{
  "script": {
    "source": "ctx._source.first_name = ctx._source.first_name.replace('信息信息','信息')"
  },
  "query": {
    "match_all": {}
  }
}
json 复制代码
//新增一条数据
PUT my-index-000001/_doc/4?refresh
{
  "first_name": "傲",
  "last_name": "寒",
  "tags":["java"]
}

//使用函数 新增一个tags 'pgsql'
POST my-index-000001/_update/4
{
  "script": {
    "source": "ctx._source.tags.add('pgsql')"
  }
}


// ctx.op文档操作 删除 id为4的数据
POST my-index-000001/_update/4
{
  "script": {
    "lang": "painless",
    "source": "ctx.op='delete'"
  }
}

script中的查询

json 复制代码
GET /my-index-000001/_search
{
  "script_fields": {
    "full_name": {
      "script": {
        "source": "params._source.first_name + '' + params._source.last_name"
      }
    }
  }
}

script在聚合中使用

json 复制代码
GET /my-index-000001/_search
{
 "query": {
   "match_all": {}
 },
 "aggs": {
   "full_name": {
     "terms": {
       "script": {
         "source": "params._source.first_name + '' + params._source.last_name"
       }
     }
   }
 }
}
相关推荐
Asthenia04123 小时前
Spring AOP 和 Aware:在Bean实例化后-调用BeanPostProcessor开始工作!在初始化方法执行之前!
后端
Asthenia04123 小时前
什么是消除直接左递归 - 编译原理解析
后端
Asthenia04124 小时前
什么是自上而下分析 - 编译原理剖析
后端
Asthenia04124 小时前
什么是语法分析 - 编译原理基础
后端
Asthenia04124 小时前
理解词法分析与LEX:编译器的守门人
后端
uhakadotcom4 小时前
视频直播与视频点播:基础知识与应用场景
后端·面试·架构
Asthenia04125 小时前
Spring扩展点与工具类获取容器Bean-基于ApplicationContextAware实现非IOC容器中调用IOC的Bean
后端
bobz9655 小时前
ovs patch port 对比 veth pair
后端
Asthenia04126 小时前
Java受检异常与非受检异常分析
后端