Elasticsearch中脚本(script)的使用

Elasticsearch中脚本的使用

​ Elasticsearch支持多种脚本语言。在 ES 中,脚本语言主要是 Painless,这是 Elasticsearch 自家开发的一种安全、高效并且易于学习的语言。除了 Painless,Elasticsearch 也支持其他几种脚本语言,如 Lucene 的表达式语言,但 Painless 是推荐和默认的选项。

以下是一些常见的使用脚本的场景:

  1. 计算字段:你可以使用脚本在查询时动态地改变或添加字段的值。
  2. 脚本查询:在查询中使用脚本进行复杂的条件判断。
  3. 脚本聚合:使用脚本进行更复杂的聚合计算。

使用脚本时需要注意的是,由于涉及到运行时的计算,过度或者不恰当的使用脚本可能会对性能造成影响。另外,由于脚本具有执行任意代码的能力,因此需要确保脚本的使用在一个安全的环境中,并且只运行信任的脚本。

1、script格式

语法都遵循相同的模式

json 复制代码
"script": {
    "lang":   "...",  
    "source" | "id": "...", 
    "params": { ... } 
  }
  • lang:指定编程语言,默认是painless,还有其他编程语言选项如expression
  • source | id: source,id二者选其一,source后面接inline脚本(就是将脚本逻辑直接放在DSL里面 ),id对应一个stored脚本(就是预先设置类似UDF,使用的时候根据UDF的id进行调用和传参
  • params:在脚本中任何有名字的参数,用params传参

2、访问文档字段和特殊变量

根据脚本的使用位置,它将有权访问某些特殊变量和文档字段。

更新 (update)中使用的脚本, 查询更新 (update_by_query),或重新索引 (reindex)API将有权访问ctx变量,该变量公开

  • ctx._source ====> 访问文档_source字段。
  • ctx.op ====> 应应用于文档的操作:indexdelete
  • ctx._index等 ===> 访问文档元数据字段,其中一些可能是只读的。

使用script脚本修改某文档的某个字段,先插入一条文档

3、示例

使用script修改一个字段:

json 复制代码
//新增一条数据
PUT my-index-000001/_doc/3?refresh
{
  "first_name": "Barry",
  "last_name": "寒"
}

//script修改一个字段
POST my-index-000001/_update/3
{
  "script": {
    "source": "ctx._source.first_name= '傲'"
  }
}

//或者
POST my-index-000001/_update/3
{
  "script": {
    "source": "ctx._source['first_name']= '不吃肥肉'"
  }
}

script脚本更新字段、除了直接使用=赋值修改的情况,还可以对字段使用函数处理数值运算,比如加减乘除开方等等

json 复制代码
//将所有 '信息信息' 字符替换为 '信息'
POST my-index-000001/_update_by_query
{
  "script": {
    "source": "ctx._source.first_name = ctx._source.first_name.replace('信息信息','信息')"
  },
  "query": {
    "match_all": {}
  }
}
json 复制代码
//新增一条数据
PUT my-index-000001/_doc/4?refresh
{
  "first_name": "傲",
  "last_name": "寒",
  "tags":["java"]
}

//使用函数 新增一个tags 'pgsql'
POST my-index-000001/_update/4
{
  "script": {
    "source": "ctx._source.tags.add('pgsql')"
  }
}


// ctx.op文档操作 删除 id为4的数据
POST my-index-000001/_update/4
{
  "script": {
    "lang": "painless",
    "source": "ctx.op='delete'"
  }
}

script中的查询

json 复制代码
GET /my-index-000001/_search
{
  "script_fields": {
    "full_name": {
      "script": {
        "source": "params._source.first_name + '' + params._source.last_name"
      }
    }
  }
}

script在聚合中使用

json 复制代码
GET /my-index-000001/_search
{
 "query": {
   "match_all": {}
 },
 "aggs": {
   "full_name": {
     "terms": {
       "script": {
         "source": "params._source.first_name + '' + params._source.last_name"
       }
     }
   }
 }
}
相关推荐
雨中散步撒哈拉25 分钟前
13、做中学 | 初一下期 Golang数组与切片
开发语言·后端·golang
0wioiw027 分钟前
Go基础(③Cobra)
开发语言·后端·golang
cci1 小时前
使用proxychains4反向代理解决依赖下载难题
后端
咖啡Beans1 小时前
Python工具DrissionPage推荐
后端·python
华仔啊2 小时前
工作5年没碰过分布式锁,是我太菜还是公司太稳?网友:太真实了!
java·后端
卿·静2 小时前
Node.js对接即梦AI实现“千军万马”视频
前端·javascript·人工智能·后端·node.js
SamDeepThinking3 小时前
在 Cursor IDE 中配置 SQLTools 连接 MySQL 数据库指南(Windows 11)
后端·ai编程·cursor
武子康3 小时前
大数据-92 Spark 深入解析 Spark Standalone 模式:组件构成、提交流程与性能优化
大数据·后端·spark
青梅主码3 小时前
麦肯锡最新发布报告《想打破生产力天花板吗?重新思考完成工作的方式》:与其一味调整组织结构,不如从根本上简化工作流程,释放更大价值
后端
Python私教3 小时前
源滚滚Rust全栈班v1.02 无符号整数详解
开发语言·后端·rust