Elasticsearch新增和删除索引中的字段

在ES中,增加字段相对比较容易,因为ES支持动态映射(Dynamic Mapping)。

当索引中新增文档时,ES可以根据文档中的字段自动创建对应的映射关系。如果新字段类型与已有字段类型不同,ES会自动将已有字段类型转换为新类型。

而删除字段则比较困难,因为ES的索引是基于倒排索引的。

当一个字段被索引后,它就会被写入到倒排索引中。

如果删除该字段,就需要删除所有文档中该字段对应的倒排索引,这个过程非常耗时和复杂。

另外,如果删除了一个字段,可能会影响已有的查询和聚合操作,因为这些操作可能依赖于该字段。

因此,在ES中删除字段不是一个常见的操作,通常需要通过创建新的索引来实现。

可以通过创建新的索引并将数据导入新索引的方式来实现增删字段的需求。

虽然这种方式需要重新建立索引,但可以保证数据的完整性和一致性。

简单说,ES实现字段删除的步骤,就是把原索引中除要删除的索引字段外的所有属性,复制到一个新索引上,然后删除就索引,再重建旧索引(没有要删除的字段),然后再把新索引的所有属性,复制到新建的旧索引上。

1、新建索引my_temp_index

2、索引my_temp_index插入一条数据

3、索引my_temp_index查询数据

4、假设要删除的字段是picture_url,先把这个字段的内容删除

注意:

只是删除数据,不是删除字段

如果不删除字段数据,后面reindex时依然会把待删除字段的值带到新索引,即使设置新索引的dynamic为false

4、新建索引my_temp_index_new,不包含picture_url字段

5、同步数据,将my_temp_index旧索引的数据,同步到新索引my_temp_index_new中。注意,这个同步操作前,一定要确保旧索引my_temp_index的picture_url属性是没有值的。否则,这个同步过程,会把picture_url字段带到新索引上

6、验证效果,查询新索引my_temp_index_new映射关系与新索引数据

7、删除原索引

8、新建一个名为原索引名的索引my_temp_index,reindex同步数据,然后删除步骤4新建的索引my_temp_index_new

以上步骤,涉及到的命令如下:

复制代码
get /my_temp_index/_mapping

get /my_temp_index_new/_mapping


DELETE /my_temp_index
DELETE /my_temp_index_new

PUT /my_temp_index
{
	"settings": {
		"number_of_shards": 5,
		"number_of_replicas": 1
	},
	"mappings": {
		"_doc": {
			"properties": {
				"commodity_id": {
					"type": "long"
				},
				"commodity_name": {
					"type": "text"
				},
				"picture_url": {
					"type": "keyword"
				},
				"price": {
					"type": "double"
				}
			}
		}
	}
}

PUT /my_temp_index_new
{
	"settings": {
		"number_of_shards": 5,
		"number_of_replicas": 1
	},
	"mappings": {
		"_doc": {
			"properties": {
				"commodity_id": {
					"type": "long"
				},
				"commodity_name": {
					"type": "text"
				},
				"price": {
					"type": "double"
				}
			}
		}
	}
}

POST /_reindex
{
    "source": {
        "index": "my_temp_index"
    },
    "dest": {
        "index": "my_temp_index_new"
    }
}

GET my_temp_index/_search
{
  "query": {
    "match_all": {}
  }
}

GET my_temp_index_new/_search
{
  "query": {
    "match_all": {}
  }
}


get my_temp_index/_mapping

post /my_temp_index/_doc
{
  "commodity_id":1,
  "commodity_name":"xxx1",
  "picture_url":"actress",
  "price": 999.00
}


POST  /my_temp_index/_update_by_query
{
    "script": {
        "lang": "painless",
        "inline": "ctx._source.remove(\"picture_url\")"
    },
    "query": {
        "match_all": {}
    }
}

参考【es】Elasticsearch新增和删除索引中的字段 - 简书

相关推荐
贝多芬也爱敲代码4 小时前
如何减小ES和mysql的同步时间差
大数据·mysql·elasticsearch
异次元的星星5 小时前
智慧新零售时代:施易德系统平衡技术与人力,赋能门店运营
大数据·零售
深思慎考6 小时前
ElasticSearch与Kibana 入门指南(7.x版本)
大数据·elasticsearch·jenkins
银行数字化转型导师坚鹏7 小时前
如何设计优秀的企业微信私域运营实战培训方案
大数据·python·企业微信
悠闲蜗牛�7 小时前
人工智能时代下的全栈开发:整合AI、大数据与云原生的实践策略
大数据·人工智能·云原生
ml魔力信息9 小时前
活体检测与防伪技术的安全与隐私分析
大数据·人工智能·安全·隐私保护·生物识别·活体检测
数据要素X10 小时前
寻梦数据空间 | 架构篇:从概念到落地的技术实践与突破性创新
大数据·运维·数据仓库·微服务·数据治理·数据中台·可信数据空间
IT学长编程11 小时前
计算机毕业设计 基于EChants的海洋气象数据可视化平台设计与实现 Python 大数据毕业设计 Hadoop毕业设计选题【附源码+文档报告+安装调试】
大数据·hadoop·python·毕业设计·课程设计·毕业论文·海洋气象数据可视化平台
呆呆小金人11 小时前
SQL入门: HAVING用法全解析
大数据·数据库·数据仓库·sql·数据库开发·etl·etl工程师
problc12 小时前
PostgreSQL + Redis + Elasticsearch 实时同步方案实践:从触发器到高性能搜索
redis·elasticsearch·postgresql