ES-mapping

类似数据库中的表结构定义,主要作用如下

定义Index下的字段名( Field Name)

定义字段的类型,比如数值型、字符串型、布尔型等定义倒排索引相关的配置,比如是否索引、记录 position 等

index_options 用于控制倒排索记录的内容,有如下4种配置

  • docs 只记录 doc id

  • freqs 记录 doc id 和 term frequencies

  • positions 记录 doc id、term frequencies 和 term position

-offsets 记录 doc id、term frequencies、term position character offsets·

text类型默认配置为 positions,其他默认为 docs。记录内容越多,占用空间越大

核心数据类型

字符串型 text、keyword

数值型 long、integer、short、 byte、 double、 float、 half float、 scaled_float

日期类型 date

布尔类型 boolean

二进制类型 binary

范围类型 integer_range、float_range、long_range、double_range、date_range

复杂数据类型

专用类型

-记录i 地址 ip

-实现自动补全 completion

-记录分词数 token_count

-记录字符串hash值murmur3

-percolator

-join

允许根据 es 自动识别的数据类型、字段名等来动态设定字段类型,可以实现如下效果

所有字符串类型都设定为 keyword 类型,即默认不分词

所有以message开头的字段都设定为 text 类型,即分词

所有以long_开头的字段都设定为 long类型

所有自动匹配为 double 类型的都设定为 float 类型,以节省空间

匹配规则一般有如下几个参数

match_mapping_type 匹配es 自动识别的字段类型,如boolean,long,string等

match,unmatch 匹配字段名

path_match,path_unmatch 匹配路径

索引模板,英文为Index Template,主要用于在新建索引时自动应用预先设定的配置简化索引创建的操作步骤

可以设定索引的配置和mapping

可以有多个模板,根据order 设置,order 大的覆盖小的配置

相关推荐
OYangxf3 小时前
Git Ignore
大数据·git·elasticsearch
Elastic 中国社区官方博客4 小时前
jina-embeddings-v5-omni:用于文本、图像、音频和视频的 embeddings
大数据·人工智能·elasticsearch·搜索引擎·ai·音视频·jina
泓博4 小时前
Openclaw-Ubuntu常用命令
大数据·elasticsearch·搜索引擎·ai
WhoAmI4 小时前
Elasticsearch实战指南:构建实时全文检索系统
elasticsearch·kafka
Elastic 中国社区官方博客6 小时前
Elasticsearch ES|QL “读取时模式”:你的未映射字段一直都在那里
大数据·数据库·sql·elasticsearch·搜索引擎·全文检索
Elastic 中国社区官方博客6 小时前
Elasticsearch 查询日志:每个查询一行协调器级别日志,适用于 ES|QL、DSL、SQL 和 EQL
大数据·数据库·sql·elasticsearch·搜索引擎·全文检索·可用性测试
risc1234561 天前
Elasticsearch的shrink为啥不用软链接用硬链接
elasticsearch·lucene
Elasticsearch1 天前
jina-embeddings-v5-omni:用于文本、图像、音频和视频的 embeddings
elasticsearch
森屿~~1 天前
CMA-ES:从搜索分布自适应到协方差矩阵学习
学习·elasticsearch·矩阵
剑神一笑1 天前
Linux tree 命令深度解析:从目录遍历到树形可视化的完整实现
linux·运维·elasticsearch