es 中使用update 、create 、index的区别

文章目录

      • [1. `index` 操作](#1. index 操作)
        • [示例:`index` 操作](#示例:index 操作)
        • [Bulk 示例中的 `index` 操作:](#Bulk 示例中的 index 操作:)
      • [2. `create` 操作](#2. create 操作)
        • [示例:`create` 操作](#示例:create 操作)
        • [Bulk 示例中的 `create` 操作:](#Bulk 示例中的 create 操作:)
      • [3. `update` 操作](#3. update 操作)
        • [示例:`update` 操作](#示例:update 操作)
        • [Bulk 示例中的 `update` 操作:](#Bulk 示例中的 update 操作:)
      • [4. 区别总结](#4. 区别总结)
      • 总结

在 Elasticsearch 中, indexupdatecreate 是常用的操作类型,它们用于不同的场景,且具有不同的行为。下面详细解释这三个操作的区别,并提供相关的示例。

1. index 操作

  • 功能index 操作用于插入文档,如果文档的 _id 已经存在,则会覆盖该文档(即进行替换)。
  • 使用场景:适用于需要插入新文档,或者更新已有文档的场景。
  • 注意index 操作是幂等的(idempotent)。即使你多次执行相同的操作,只要文档内容没有变化,最终结果不会受到影响。
示例:index 操作
json 复制代码
POST /articles/_doc/1
{
  "title": "Tech News Today",
  "tags": ["tech", "news", "AI"]
}
  • 如果 _id1 的文档不存在,则会插入一个新的文档。

    POST /articles/_search

    [
    {
    "_index" : "articles",
    "_type" : "_doc",
    "_id" : "1",
    "_score" : 1.0,
    "_source" : {
    "title" : "Tech News Today",
    "tags" : [
    "tech",
    "news",
    "AI"
    ]
    }
    }
    ]

  • 如果 _id1 的文档已存在,则会被替换为新的文档。

    POST /articles/_doc/1
    {
    "title": "Tech News Today"
    }

    POST /articles/_search

    [
    {
    "_index" : "articles",
    "_type" : "_doc",
    "_id" : "1",
    "_score" : 1.0,
    "_source" : {
    "title" : "Tech News Today"
    }
    }
    ]

Bulk 示例中的 index 操作:
json 复制代码
{ "index": { "_id": 1 } }
{ "title": "Tech News Today", "tags": ["tech", "news", "AI"] }

2. create 操作

  • 功能create 操作用于插入新文档。如果文档的 _id 已经存在,操作会失败(返回错误)。这意味着该操作只能用于创建新文档,而不能更新或替换已有文档。
  • 使用场景:适用于你想要确保文档不存在时插入文档的情况。比如避免覆盖现有的文档。
示例:create 操作
json 复制代码
POST /articles/_doc/1/_create
{
  "title": "Tech News Today",
  "tags": ["tech", "news", "AI"]
}
  • 如果 _id1 的文档已存在,Elasticsearch 会返回错误,提示该文档已经存在。

    {
    "error" : {
    "root_cause" : [
    {
    "type" : "version_conflict_engine_exception",
    "reason" : "[1]: version conflict, document already exists (current version [2])",
    "index_uuid" : "mu6PYHhxTRSOOOjSZoPmaQ",
    "shard" : "0",
    "index" : "articles"
    }
    ],
    "type" : "version_conflict_engine_exception",
    "reason" : "[1]: version conflict, document already exists (current version [2])",
    "index_uuid" : "mu6PYHhxTRSOOOjSZoPmaQ",
    "shard" : "0",
    "index" : "articles"
    },
    "status" : 409
    }

  • 如果 _id1 的文档不存在,它将会被插入。

Bulk 示例中的 create 操作:
json 复制代码
{ "create": { "_id": 1 } }
{ "title": "Tech News Today", "tags": ["tech", "news", "AI"] }

3. update 操作

  • 功能update 操作用于更新已有的文档。如果文档存在,它会更新文档的部分内容;如果文档不存在,则会抛出错误。
  • 使用场景 :适用于部分更新文档的场景,特别是当你只需要更新文档的一部分字段时。update 操作不会覆盖整个文档,只会对指定字段进行修改。
示例:update 操作
json 复制代码
POST /articles/_doc/1/_update
{
  "doc": {
    "tags": ["tech", "news", "AI", "machine learning"]
  }
}
  • 如果 _id1 的文档存在,tags 字段将会被更新为新的值。

    POST /articles/_search

    [
    {
    "_index" : "articles",
    "_type" : "_doc",
    "_id" : "1",
    "_score" : 1.0,
    "_source" : {
    "title" : "Tech News Today",
    "tags" : [
    "tech",
    "news",
    "AI",
    "machine learning"
    ]
    }
    }
    ]

  • 如果 _id1 的文档不存在,Elasticsearch 会返回错误。

    DELETE articles

    POST /articles/_doc/1/_update
    {
    "doc": {
    "tags": ["tech", "news", "AI", "machine learning"]
    }
    }

    {
    "error" : {
    "root_cause" : [
    {
    "type" : "document_missing_exception",
    "reason" : "[_doc][1]: document missing",
    "index_uuid" : "B9MrCqCwT5u-GCvgdWB-Rw",
    "shard" : "0",
    "index" : "articles"
    }
    ],
    "type" : "document_missing_exception",
    "reason" : "[_doc][1]: document missing",
    "index_uuid" : "B9MrCqCwT5u-GCvgdWB-Rw",
    "shard" : "0",
    "index" : "articles"
    },
    "status" : 404
    }

Bulk 示例中的 update 操作:
json 复制代码
{ "update": { "_id": 1 } }
{ "doc": { "tags": ["tech", "news", "AI", "machine learning"] } }

4. 区别总结

操作类型 目标 说明 示例
index 插入或替换 文档插入,如果文档已经存在则会被替换。 POST /articles/_doc/1
create 插入 仅在文档不存在时插入文档,如果文档已存在,则返回错误。 POST /articles/_doc/1/_create
update 更新 仅更新文档的一部分内容,文档必须存在。如果文档不存在,则返回错误。 POST /articles/_doc/1/_update

总结

  • index 用于插入新文档或替换现有文档。
  • create 用于仅在文档不存在时插入新文档,若文档已存在则返回错误。
  • update 用于更新现有文档的部分内容,若文档不存在则返回错误。
相关推荐
bigdata-rookie3 分钟前
Spark shuffle 和 MapReduce shuffle 的区别
大数据·spark·mapreduce
hans汉斯5 分钟前
国产生成式人工智能解决物理问题能力研究——以“智谱AI”、“讯飞星火认知大模型”、“天工”、“360智脑”、“文心一言”为例
大数据·人工智能·算法·aigc·文心一言·汉斯出版社·天工
发哥来了7 分钟前
主流AI视频生成商用方案选型评测:关键能力与成本效益分析
大数据·人工智能·音视频
yuluo_YX9 分钟前
Alias for Linux/Mac
linux·elasticsearch·macos
TracyCoder12310 分钟前
ElasticSearch内存管理与操作系统(三):并发控制与线程模型
大数据·elasticsearch·搜索引擎
B站计算机毕业设计超人20 分钟前
计算机毕业设计hadoop+spark+hive在线教育可视化 课程推荐系统 大数据毕业设计(源码+LW文档+PPT+讲解)
大数据·人工智能·hive·hadoop·scrapy·spark·课程设计
B站计算机毕业设计超人21 分钟前
计算机毕业设计PySpark+Hive+Django小红书评论情感分析 小红书笔记可视化 小红书舆情分析预测系统 大数据毕业设计(源码+LW+PPT+讲解)
大数据·人工智能·hive·爬虫·python·spark·课程设计
Lethehong30 分钟前
探索高效工作流的秘密:GLM-4.7 与 Dify 平台深度集成实践
大数据·人工智能·算法
大鳥33 分钟前
第一章 - 数据仓库是什么
大数据·数据库·hive
TM1Club10 小时前
AI驱动的预测:新的竞争优势
大数据·人工智能·经验分享·金融·数据分析·自动化