Elasticsearch之下

网络分区 → 多个 Master 同时存在 → 数据写坏
对策：
- discovery.zen.minimum_master_nodes = (master_eligible_nodes / 2) + 1（7.x 前）
- 7.x+ 用 Raft，自动防脑裂

如果挂的是 Data Node ：
- Primary Shard 挂了？→ 自动提升 Replica 为 Primary
- 集群状态变 Yellow（副本缺失），但服务不中断！
如果挂的是 Master Node ：
- 其他 Master-eligible 节点自动选举新老大（基于 Zen Discovery 或新版 Raft）

💡 最佳实践：

至少 3 个 Master 节点（防脑裂）

Data 节点按角色分离（hot-warm-cold 架构）

一个复杂聚合占满 CPU → 其他查询排队 → 集群 hang
对策：
- search.default_search_timeout（超时熔断）
- indices.breaker.*（内存熔断）
- 监控 thread_pool.search.rejected

Logstash/Filebeat → Kafka → Spark/Flink → ES Bulk Write

场景	为什么不适合	正确姿势
强事务	ES 不支持 ACID	用 MySQL，ES 只做搜索同步
频繁更新	更新 = 删除+重建，性能差	少量更新 or 用 `_update` 脚本
大宽表 JOIN	不支持 JOIN	用 Nested / Parent-Child（慎用）或应用层关联
精确计数（10亿级）	`total: 10000+` 是估算	用 `track_total_hits=true`（性能代价大）

✅ 记住：
ES 是"搜索加速器"，不是"主数据库"！

ES 不是银弹，而是一套精密的权衡系统：

用 空间换时间（Doc Values + 副本）

用 延迟换吞吐（Refresh 间隔）

用 复杂度换能力（分布式协调）

真正的大神，不是会用 ES，而是知道什么时候不该用 ES。

"如果你还在用 LIKE %keyword% 做搜索，那你不是在查数据，你是在给用户表演'系统正在思考人生'。"