Springboot整合原生ES依赖

前言

Springboot整合依赖大概有三种方式:

  • es原生依赖:elasticsearch-rest-high-level-client
  • Spring Data Elasticsearch
  • Easy-es

三者的区别

1. Elasticsearch Rest High Level Client

简介:

  • 这是官方提供的 Elasticsearch 客户端,支持 Java 应用程序与 Elasticsearch 集群进行通信。

特点:

  • 低级别 API: 提供对 Elasticsearch 的低级别 REST API 封装,允许开发者直接使用 Elasticsearch 的所有功能。
  • 灵活性: 可以执行所有 Elasticsearch 支持的操作,如索引、搜索、更新和删除等。
  • 直接的控制: 开发者可以手动构造请求和处理响应,提供了更大的控制权。
  • 与 Elasticsearch 版本保持同步: 由于是官方客户端,可以更好地与 Elasticsearch 版本进行兼容。

使用场景:

  • 适合需要精细控制和高灵活性的应用,特别是在处理复杂的查询或需要使用 Elasticsearch 的高级特性时。

2. Spring Data Elasticsearch

简介:

  • 这是 Spring 生态系统中的一部分,旨在简化使用 Elasticsearch 的过程,提供了更高层次的抽象。

特点:

  • 集成 Spring: 提供与 Spring 框架的无缝集成,支持依赖注入、配置和自动化管理。
  • Repository 模式: 使用类似于 Spring Data JPA 的 Repository 接口,可以更方便地执行 CRUD 操作和查询。
  • 实体映射: 支持将 Java 对象直接映射到 Elasticsearch 文档,简化了数据的处理。
  • 注解支持: 通过注解定义索引、字段和查询,减少了样板代码。

使用场景:

  • 适合已经在使用 Spring 的应用程序,特别是希望快速实现与 Elasticsearch 的集成,同时享受 Spring 提供的便利。

3. Easy-ES

简介:

  • Easy-ES 是一个第三方的 Java 客户端库,旨在简化 Elasticsearch 的操作,提供更为便捷的 API。

特点:

  • 简化 API: 封装了 Elasticsearch 的复杂性,使得操作更简单易用,尤其是在批量操作和查询时。
  • 注解驱动: 提供了注解来配置索引和字段,使得使用更加直观。
  • 支持多种数据源: 除了支持 Elasticsearch 外,还能与其他数据源进行集成。
  • 灵活配置: 提供了多种配置选项,方便用户定制化。

使用场景:

  • 适合需要简化 Elasticsearch 操作的开发者,特别是在处理简单应用或快速开发时,能够提高开发效率。

总结

  • Elasticsearch Rest High Level Client: 提供全面的 API 访问,适合需要直接控制和高灵活性的场景。
  • Spring Data Elasticsearch: 适合与 Spring 应用集成,简化数据访问的同时保持 Spring 风格。
  • Easy-ES: 更加简化的 API,适合快速开发和简单应用,特别适合对 Elasticsearch 操作不太熟悉的开发者。

Elasticsearch Rest High Level Client整合

1、添加依赖

xml 复制代码
 <dependency>
            <groupId>org.elasticsearch.client</groupId>
            <artifactId>elasticsearch-rest-client</artifactId>
            <version>7.3.2</version>
        </dependency>
        <dependency>
            <groupId>org.elasticsearch.client</groupId>
            <artifactId>elasticsearch-rest-high-level-client</artifactId>
            <version>7.3.2</version>
        </dependency>
        <dependency>
            <groupId>org.elasticsearch</groupId>
            <artifactId>elasticsearch</artifactId>
            <version>7.3.2</version>
        </dependency>

<!-- ...其他依赖省略 具体可以才看源码 -->

2、属性类添加

EsProperties

主要用于读取yaml文件的配置

java 复制代码
package com.walker.es.properites;

import lombok.Data;
import org.springframework.boot.context.properties.ConfigurationProperties;
import org.springframework.stereotype.Component;

@ConfigurationProperties(prefix = "es")
@Component
@Data
public class EsProperties {
    private String host;
    private Integer port;
    private String scheme;
    private EsSecurityProperites security;
}
java 复制代码
package com.walker.es.properites;

import lombok.Data;

@Data
public class EsSecurityProperites {
    private String username;
    private String password;
    private boolean enable;
}

3、application.yaml配置添加

根据自己的es配置进行修改,

这里添加了账号密码配置,一般来说,配置一下安全一些,否则容易被攻击

yaml 复制代码
es:
  host: localhost
  port: 19200
  scheme: http
#  配置账号密码
  security:
    enable: true
    username: elastic
    password: elastic

4、ES配置类

主要用于创建RestHighLevelClient类,该类是es的客户端工具类,方法都集成在该类中

java 复制代码
package com.walker.es.config;

import com.walker.es.properites.EsProperties;
import com.walker.es.properites.EsSecurityProperites;
import lombok.extern.slf4j.Slf4j;
import org.apache.http.HttpHost;
import org.apache.http.auth.AuthScope;
import org.apache.http.auth.UsernamePasswordCredentials;
import org.apache.http.impl.client.BasicCredentialsProvider;
import org.elasticsearch.client.RestClient;
import org.elasticsearch.client.RestClientBuilder;
import org.elasticsearch.client.RestHighLevelClient;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;

@Slf4j
@Configuration
public class EsConfig {
    @Autowired
    private EsProperties esProperties;

//    注入restHighLevelClient到bean中
    @Bean
    public RestHighLevelClient restHighLevelClient(){

//        构建es客户端
        RestClientBuilder builder = RestClient.builder( new HttpHost(esProperties.getHost(),
                esProperties.getPort(), esProperties.getScheme()));

        // 是否需要开启账号密码验证
        EsSecurityProperites security = esProperties.getSecurity();
        if(security!=null&&security.isEnable()){
            log.info("es~开启账号密码验证!");
            BasicCredentialsProvider credentialsProvider = new BasicCredentialsProvider();
            credentialsProvider.setCredentials(AuthScope.ANY,
                    new UsernamePasswordCredentials(security.getUsername(), security.getPassword()));
            builder.setHttpClientConfigCallback(httpClientBuilder ->
                    httpClientBuilder.setDefaultCredentialsProvider(credentialsProvider));
        }

        log.info("构建RestHighLevelClient:{}",esProperties);

        return new RestHighLevelClient(builder);
 
    }
}

5、测试验证

实体类

java 复制代码
package com.walker.es.model;

import lombok.Data;

@Data
public class AlarmRecordEntity {
//    事件
    private String title;
//    设备
    private String deviceCode;
//    时间
    private String time;

//    索引名称
    public static String getIndex(){
        return "alarms";
    }

}

controller类

主要有下面的接口方法

创建索引
  • 直接执行新增client.index(indexRequest, RequestOptions.DEFAULT); 也可以创建索引,但是直接创建的索引,字段的配置就都是默认的,例如我们如果需要使用中文分词器,就需要重新创建索引,这个在生产环境来说是比较麻烦的,需要迁移数据
  • 索引可以单独写一个接口去创建索引,指定好字段的属性。
java 复制代码
@PostMapping("/createIndex")
    public String createIndex() {
        CreateIndexRequest request = new CreateIndexRequest(AlarmRecordEntity.getIndex());

//        设置别名
        request.alias(new Alias("alias_alarm"));

        // 设置索引的设置(可选)
        request.settings(Settings.builder()
                .put("number_of_shards", 3)  // 分片数量
                .put("number_of_replicas", 2) // 副本数量
                .put("analysis.tokenizer.ik_max_word.type", "ik_max_word") // 使用 ik_max_word 分词器
        );

        // 使用 HashMap 创建映射
        Map<String, Object> properties = new HashMap<>();
        Map<String, Object> titleField = new HashMap<>();
        titleField.put("type", "text");
        titleField.put("analyzer", "ik_max_word"); // 配置中文分词器
        properties.put("title", titleField);

        Map<String, Object> deviceCodeField = new HashMap<>();
        deviceCodeField.put("type", "keyword");
        properties.put("deviceCode", deviceCodeField);

        Map<String, Object> timeField = new HashMap<>();
        timeField.put("type", "date");
        properties.put("time", timeField);

        // 设置映射
        HashMap<String, Object> map = new HashMap<>();
        map.put("properties", properties);
        request.mapping(map);

        try {
            client.indices().create(request, RequestOptions.DEFAULT);
            return "Index created successfully";
        } catch (IOException e) {
            e.printStackTrace();
            return "Error creating index: " + e.getMessage();
        }
    }

调用后:

在kibana中可以看到

  • 可以看到分片,副本等数量,以及存储的大小、别名等

  • 别名的作用也是很大的,如果后面索引太大,然后使用日期等配置索引的时候,就有作用了

  • mapping 映射 字段的类型,以及分词器

es的字段类型主要有以下这些:

java 复制代码
1. 基本数据类型
String: 以前用于文本和关键词。现在使用以下两种类型替代:

text: 用于全文搜索,支持分词。
keyword: 用于精确匹配,不支持分词,适合用于过滤、排序和聚合。
Numeric Types:

integer: 整数类型(32位)。
long: 长整数类型(64位)。
float: 单精度浮点数(32位)。
double: 双精度浮点数(64位)。
short: 短整型(16位)。
byte: 字节类型(8位)。
Date: 日期类型,支持多种日期格式。

2. 布尔类型
boolean: 布尔类型,只能取值 true 或 false。
3. 复杂数据类型
Object: 嵌套的 JSON 对象,可以包含其他字段。

Nested: 嵌套对象,支持对嵌套文档的查询,保持对象之间的关联性。

4. 特殊类型
geo_point: 地理坐标类型,存储经纬度信息。

geo_shape: 用于存储复杂的地理形状数据(如多边形等)。

ip: 存储 IP 地址。

5. 二进制类型
binary: 存储二进制数据,支持 Base64 编码的内容。
6. 列表类型
Elasticsearch 也支持字段的数组形式,可以将多个值存储在同一个字段中
增加单条记录
java 复制代码
// 增加单条报警记录
    @PostMapping("/createAlarm")
    public String createAlarm(@RequestBody AlarmRecordEntity alarmRecord) throws IOException {
        IndexRequest indexRequest = new IndexRequest(AlarmRecordEntity.getIndex())
                .source("title", alarmRecord.getTitle(),
                        "deviceCode", alarmRecord.getDeviceCode(),
                        "time", alarmRecord.getTime());
//        创建单条数据 使用index
        client.index(indexRequest, RequestOptions.DEFAULT);
        return "Alarm record created";
    }
  • 使用index增加单条数据
  • 如果使用执行该index的时候,索引不存在,则会自己创建索引,例如将index改为alarms222,则可以看到执行的结果

但是他的配置使用的都是默认的

批量增加
java 复制代码
    // 批量增加报警记录
    @PostMapping("/bulk")
    public String bulkCreateAlarms(@RequestBody List<AlarmRecordEntity> alarmRecords) throws IOException {

//        批量增加数据 使用bulk方法
        BulkRequest bulkRequest = new BulkRequest();
        for (AlarmRecordEntity alarmRecord : alarmRecords) {
            IndexRequest indexRequest = new IndexRequest(AlarmRecordEntity.getIndex())
                    .source("title", alarmRecord.getTitle(),
                            "deviceCode", alarmRecord.getDeviceCode(),
                            "time", alarmRecord.getTime());
            bulkRequest.add(indexRequest);
        }
        BulkResponse bulkResponse = client.bulk(bulkRequest, RequestOptions.DEFAULT);

        if (bulkResponse.hasFailures()) {
            return "Failed to create some alarm records: " + bulkResponse.buildFailureMessage();
        }

        return "Batch alarm records created successfully";
    }

使用bulk插入多条数据

至于修改、删除、查询单个记录等,便不在多说,可以查看源码并进行调用

搜索
java 复制代码
    @PostMapping("/search")
    public ResponseEntity<List<AlarmRecordEntity>> searchAlarms(@RequestBody AlarmSearchRequest request) {
        try {
            // 创建搜索请求
            SearchRequest searchRequest = new SearchRequest(AlarmRecordEntity.getIndex());
            SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();

            // 分词查询
            if (StrUtil.isNotBlank(request.getTitle())) {
                sourceBuilder.query(QueryBuilders.matchQuery("title", request.getTitle()));
            }

//            精确查询
            if(StrUtil.isNotBlank(request.getDeviceCode()))  {
                sourceBuilder.query(QueryBuilders.termQuery("deviceCode", request.getDeviceCode()));
            }

            // 时间范围查询(假设时间字段是一个日期格式)
            if (StrUtil.isNotBlank(request.getStartTime())) {
                sourceBuilder.query(QueryBuilders.rangeQuery("time").gte(request.getStartTime()).lte(request.getEndTime()));
            }

            // 将构建好的查询条件放入搜索请求中
            searchRequest.source(sourceBuilder);

            // 执行搜索
            SearchResponse response = client.search(searchRequest, RequestOptions.DEFAULT);

            // 解析搜索结果
            List<AlarmRecordEntity> alarms = new ArrayList<>();
            response.getHits().forEach(hit -> {
                AlarmRecordEntity alarm = new AlarmRecordEntity();
                alarm.setTitle((String) hit.getSourceAsMap().get("title"));
                alarm.setDeviceCode((String) hit.getSourceAsMap().get("deviceCode"));
                alarm.setTime((String) hit.getSourceAsMap().get("time"));
                alarms.add(alarm);
            });
            return ResponseEntity.ok(alarms); // 返回 200 状态和报警记录列表
        } catch (Exception e) {
            return ResponseEntity.status(500).body(null); // 返回 500 状态和错误信息
        }
    }
  • 验证一下是否会分词

请求参数

java 复制代码
{
  "title": "打架"
}

搜索结果

  • deviceCode精确查询
java 复制代码
{
  "title": "",
  "deviceCode": "A001",
  "startTime": "",
  "endTime": ""
}

返回结果:

  • 时间范围
java 复制代码
{
  "title": "",
  "deviceCode": "",
  "startTime": "2024-10-20",
  "endTime": "2024-10-25"
}

返回结果:

总结

大概先做这些演示,不过在实际的过程中,使用原生的es依赖可能也不是最优选,因为会有很多字段需要手打,而不是直接方法获取

所以后面会演示使用spring封装的es依赖,以及easy-es的整合,敬请期待!

源码

https://gitee.com/shen-chuhao/walker_open_java.git

相关推荐
双子座断点几秒前
QT 机器视觉 (3. 虚拟相机SDK、测试工具)
qt·1024程序员节
20岁30年经验的码农13 分钟前
爬虫基础
1024程序员节
licy__32 分钟前
计算机网络IP地址分类,子网掩码,子网划分复习资料
1024程序员节
Chris-zz1 小时前
Linux:磁盘深潜:探索文件系统、连接之道与库的奥秘
linux·网络·c++·1024程序员节
JasonYin~1 小时前
《探索 HarmonyOS NEXT(5.0):开启构建模块化项目架构奇幻之旅 —— 模块化基础篇》
1024程序员节
Teamol20202 小时前
求助帖:ubuntu22.10 auto install user-data配置了为何还需要选择语言键盘(如何全自动)
linux·ubuntu·1024程序员节
尘佑不尘2 小时前
shodan5,参数使用,批量查找Mongodb未授权登录,jenkins批量挖掘
数据库·笔记·mongodb·web安全·jenkins·1024程序员节
SeniorMao0073 小时前
结合Intel RealSense深度相机和OpenCV来实现语义SLAM系统
1024程序员节
网安_秋刀鱼3 小时前
CSRF防范及绕过
前端·安全·web安全·网络安全·csrf·1024程序员节