es 中使用update 、create 、index的区别

文章目录

      • [1. `index` 操作](#1. index 操作)
        • [示例:`index` 操作](#示例:index 操作)
        • [Bulk 示例中的 `index` 操作:](#Bulk 示例中的 index 操作:)
      • [2. `create` 操作](#2. create 操作)
        • [示例:`create` 操作](#示例:create 操作)
        • [Bulk 示例中的 `create` 操作:](#Bulk 示例中的 create 操作:)
      • [3. `update` 操作](#3. update 操作)
        • [示例:`update` 操作](#示例:update 操作)
        • [Bulk 示例中的 `update` 操作:](#Bulk 示例中的 update 操作:)
      • [4. 区别总结](#4. 区别总结)
      • 总结

在 Elasticsearch 中, indexupdatecreate 是常用的操作类型,它们用于不同的场景,且具有不同的行为。下面详细解释这三个操作的区别,并提供相关的示例。

1. index 操作

  • 功能index 操作用于插入文档,如果文档的 _id 已经存在,则会覆盖该文档(即进行替换)。
  • 使用场景:适用于需要插入新文档,或者更新已有文档的场景。
  • 注意index 操作是幂等的(idempotent)。即使你多次执行相同的操作,只要文档内容没有变化,最终结果不会受到影响。
示例:index 操作
json 复制代码
POST /articles/_doc/1
{
  "title": "Tech News Today",
  "tags": ["tech", "news", "AI"]
}
  • 如果 _id1 的文档不存在,则会插入一个新的文档。

    POST /articles/_search

    [
    {
    "_index" : "articles",
    "_type" : "_doc",
    "_id" : "1",
    "_score" : 1.0,
    "_source" : {
    "title" : "Tech News Today",
    "tags" : [
    "tech",
    "news",
    "AI"
    ]
    }
    }
    ]

  • 如果 _id1 的文档已存在,则会被替换为新的文档。

    POST /articles/_doc/1
    {
    "title": "Tech News Today"
    }

    POST /articles/_search

    [
    {
    "_index" : "articles",
    "_type" : "_doc",
    "_id" : "1",
    "_score" : 1.0,
    "_source" : {
    "title" : "Tech News Today"
    }
    }
    ]

Bulk 示例中的 index 操作:
json 复制代码
{ "index": { "_id": 1 } }
{ "title": "Tech News Today", "tags": ["tech", "news", "AI"] }

2. create 操作

  • 功能create 操作用于插入新文档。如果文档的 _id 已经存在,操作会失败(返回错误)。这意味着该操作只能用于创建新文档,而不能更新或替换已有文档。
  • 使用场景:适用于你想要确保文档不存在时插入文档的情况。比如避免覆盖现有的文档。
示例:create 操作
json 复制代码
POST /articles/_doc/1/_create
{
  "title": "Tech News Today",
  "tags": ["tech", "news", "AI"]
}
  • 如果 _id1 的文档已存在,Elasticsearch 会返回错误,提示该文档已经存在。

    {
    "error" : {
    "root_cause" : [
    {
    "type" : "version_conflict_engine_exception",
    "reason" : "[1]: version conflict, document already exists (current version [2])",
    "index_uuid" : "mu6PYHhxTRSOOOjSZoPmaQ",
    "shard" : "0",
    "index" : "articles"
    }
    ],
    "type" : "version_conflict_engine_exception",
    "reason" : "[1]: version conflict, document already exists (current version [2])",
    "index_uuid" : "mu6PYHhxTRSOOOjSZoPmaQ",
    "shard" : "0",
    "index" : "articles"
    },
    "status" : 409
    }

  • 如果 _id1 的文档不存在,它将会被插入。

Bulk 示例中的 create 操作:
json 复制代码
{ "create": { "_id": 1 } }
{ "title": "Tech News Today", "tags": ["tech", "news", "AI"] }

3. update 操作

  • 功能update 操作用于更新已有的文档。如果文档存在,它会更新文档的部分内容;如果文档不存在,则会抛出错误。
  • 使用场景 :适用于部分更新文档的场景,特别是当你只需要更新文档的一部分字段时。update 操作不会覆盖整个文档,只会对指定字段进行修改。
示例:update 操作
json 复制代码
POST /articles/_doc/1/_update
{
  "doc": {
    "tags": ["tech", "news", "AI", "machine learning"]
  }
}
  • 如果 _id1 的文档存在,tags 字段将会被更新为新的值。

    POST /articles/_search

    [
    {
    "_index" : "articles",
    "_type" : "_doc",
    "_id" : "1",
    "_score" : 1.0,
    "_source" : {
    "title" : "Tech News Today",
    "tags" : [
    "tech",
    "news",
    "AI",
    "machine learning"
    ]
    }
    }
    ]

  • 如果 _id1 的文档不存在,Elasticsearch 会返回错误。

    DELETE articles

    POST /articles/_doc/1/_update
    {
    "doc": {
    "tags": ["tech", "news", "AI", "machine learning"]
    }
    }

    {
    "error" : {
    "root_cause" : [
    {
    "type" : "document_missing_exception",
    "reason" : "[_doc][1]: document missing",
    "index_uuid" : "B9MrCqCwT5u-GCvgdWB-Rw",
    "shard" : "0",
    "index" : "articles"
    }
    ],
    "type" : "document_missing_exception",
    "reason" : "[_doc][1]: document missing",
    "index_uuid" : "B9MrCqCwT5u-GCvgdWB-Rw",
    "shard" : "0",
    "index" : "articles"
    },
    "status" : 404
    }

Bulk 示例中的 update 操作:
json 复制代码
{ "update": { "_id": 1 } }
{ "doc": { "tags": ["tech", "news", "AI", "machine learning"] } }

4. 区别总结

操作类型 目标 说明 示例
index 插入或替换 文档插入,如果文档已经存在则会被替换。 POST /articles/_doc/1
create 插入 仅在文档不存在时插入文档,如果文档已存在,则返回错误。 POST /articles/_doc/1/_create
update 更新 仅更新文档的一部分内容,文档必须存在。如果文档不存在,则返回错误。 POST /articles/_doc/1/_update

总结

  • index 用于插入新文档或替换现有文档。
  • create 用于仅在文档不存在时插入新文档,若文档已存在则返回错误。
  • update 用于更新现有文档的部分内容,若文档不存在则返回错误。
相关推荐
疯狂的沙粒1 小时前
如何通过git命令查看项目连接的仓库地址?
大数据·git·elasticsearch
随缘而动,随遇而安1 小时前
第七十四篇 高并发场景下的Java并发容器:用生活案例讲透技术原理
java·大数据·后端
凯禾瑞华实训室建设1 小时前
老年生活照护实训室建设规划:照护质量评估与持续改进实训体系
大数据·人工智能·物联网·ar·vr
静听山水1 小时前
DTS 数据迁移
大数据
科技资讯快报2 小时前
告别Prompt依赖,容联云让智能体嵌入金融业务流
大数据·人工智能·prompt
weixin_贾2 小时前
不确定性分析在LEAP能源-环境系统建模中的整合与应用
大数据·新能源·储能·碳中和·温室气体·leap模型
qq_463944862 小时前
【Spark征服之路-2.3-Spark运行架构】
大数据·架构·spark
长河2 小时前
Flink 重启后事件被重复消费的原因与解决方案
大数据·flink
TDengine (老段)2 小时前
TDengine 替换 Hadoop,彻底解决数据丢失问题 !
大数据·数据库·hadoop·物联网·时序数据库·tdengine·涛思数据
立控信息(lkone)3 小时前
库室联管联控系统
大数据·安全