Elasticsearch

Elasticsearch

1、数据库、Redis、同步如何做?

使用Mysql用来存储数据(可靠性最高的主数据源),用Es来做全文检索和特殊查询,用redis来做缓存。

数据同步方案常见的2种:

1.同步双写

最简单,在将数据写到mysql时,同时将数据写到ES或者redis。

缺点:

1、 硬编码,有需要写入mysql的地方都需要添加写入ES的代码;

2、 业务强耦合;

3、 存在双写失败丢数据风险;

4、 性能较差:本来mysql的性能不是很高,再加一个ES,系统的性能必然会下降。

异步双写(MQ方式)

针对多数据源写入的场景,可以借助MQ实现异步的多源写入。通过MQ的可靠性保证一致性。

2、精确查询常见的有哪些?

  • term查询:根据词条精确匹配,一般搜索keyword类型、数值类型、布尔类型、日期类型字段
  • range查询:根据数值范围查询,可以是数值、日期的范围
    基本语法:
json 复制代码
// term查询
GET /indexName/_search
{
  "query": {
    "term": {
      "FIELD": {
        "value": "VALUE"
      }
    }
  }
}
// range查询
GET /indexName/_search
{
  "query": {
    "range": {
      "FIELD": {
        "gte": 10, // 这里的gte代表大于等于,gt则代表大于
        "lte": 20 // lte代表小于等于,lt则代表小于
      }
    }
  }
}

3.DSL查询分类

Elasticsearch提供了基于JSON的DSL(Domain Specific Language)来定义查询。常见的查询类型包括:

  • 查询所有:查询出所有数据,一般测试用。例如:match_all

  • 全文检索(full text)查询:利用分词器对用户输入内容分词,然后去倒排索引库中匹配。例如:

    • match_query
    • multi_match_query
  • 精确查询:根据精确词条值查找数据,一般是查找keyword、数值、日期、boolean等类型字段。例如:

    • ids
    • range
    • term
  • 地理(geo)查询:根据经纬度查询。例如:

    • geo_distance
    • geo_bounding_box
  • 复合(compound)查询:复合查询可以将上述各种查询条件组合起来,合并查询条件。例如:

    • bool
    • function_score
相关推荐
京东零售技术3 小时前
Hudi系列:Hudi核心概念之索引(Indexs)
大数据
INFINI Labs3 小时前
Elasticsearch 备份:snapshot 镜像使用篇
大数据·elasticsearch·搜索引擎·snapshot·backup
代码匠心4 小时前
从零开始学Flink:流批一体的执行模式
java·大数据·后端·flink·大数据处理
小黄人软件4 小时前
用AI写的【实时文件搜索引擎】python源码【找资源】
开发语言·python·搜索引擎
数据智能老司机5 小时前
Snowflake Cortex AI:面向生成式 AI 应用的解决方案——理解 Snowflake Cortex
大数据·架构·数据分析
数据智能老司机5 小时前
Snowflake Cortex AI:面向生成式 AI 应用的解决方案——Snowflake 生态中的 AI/ML 入门
大数据·架构·数据分析
鸿儒之观7 小时前
dinky提交flink任务报 java.lang.OutOfMemoryError: Direct buffer memory
大数据·flink
YangYang9YangYan7 小时前
理财经理的职业进阶:核心技能与成长路径解析
大数据·金融·数据分析
shinelord明7 小时前
【大数据开发实践】Kafka REST Proxy~无缝集成 Kafka
大数据·分布式·架构·kafka