ElasticSearch-数据建模

姜希成2024-09-06 12:35

处理关联关系
- Object: 优先考虑反范式（Denormalization）
- Nested: 当数据包含多数值对象，同时有查询需求
- Child/Parent：关联文档更新非常频繁时
避免过多字段
- 一个文档中，最好避免大量的字段
  - 过多的字段数不容易维护
  - Mapping 信息保存在 Cluster State 中，数据量过大，对集群性能会有影响
  - 删除或者修改数据需要reindex
- 默认最大字段数是1000，可以设置index.mapping.total_fields.limit限定最大字段数
- 生产环境中，尽量不要打开 Dynamic，可以使用Strict控制新增字段的加入
  - true ：未知字段会被自动加入
  - false ：新字段不会被索引，但是会保存在_source
  - strict ：新增字段不会被索引，文档写入失败
- 对于多属性的字段，比如cookie，商品属性，可以考虑使用Nested
避免正则，通配符，前缀查询
- 正则，通配符查询，前缀查询属于Term查询，但是性能不够好
- 特别是将通配符放在开头，会导致性能的灾难
避免空值引起的聚合不准

rest 复制代码

PUT /scores
{"mappings":{"properties":{"score":{"type":"float","null_value":0}}}}

rest 复制代码

PUT /my_index
{"mappings":{"_meta":{"index_version_mapping":"1.1"}}}