ElasticSearch批处理

在刚才的新增当中,我们是一次新增一条数据。那么如果你将来的数据库里有数千上万的数据,你一次新增一个,那得多麻烦。所以我们还要学习一下批量导入功能。

也就是说批量的把数据库的数据写入索引库。那这里的需求是,首先利用mybatisplus去批量查询酒店数据,然后将查询到的酒店数据,也就是hotel把它转换成我们的hotelDoc文档类型。最后再利用我们的这个Bulk批处理方式实现批量新增:

java 复制代码
@Test
void testCreateHotelIndex() throws IOException{
//创建索引库 CreateIndexReqeust
//1、创建Request对象:
CreateIndexRequest request = new CreateIndexRequest("hotel");
//2、请求参数:
request.source(MAPPING_TEMPLATE, XContentType.JSON);
//3、发送请求
client.indices().create(request,RequestOptions.DEFAULT);
}

//1、创建DeleteIndexRequset
DeleteIndexReqeust reqeust = new DeleteIndexReqeust("hotel");
client.indices().delete(reqeust. ReqeustOptions.DEFAULT);

//判读索引库是否存在:
GetIndexReqeust request = new GetIndexRequest("hotel");

boolean exists = client.indices().exists(reqeust, RequestOptions.DEFAULT);





@Test
void testBulkRequest() throws IOException{

	List<Hotel> hotels = hoteService.list();
	BulkRequest request = new BulkRequest();
	for(Hotel hotel : hotels){
		HotelDoc hotelDoc = new HotelDoc(hotel);
		request.add(new IndexRequest("hotel"))
		             .id(hotelDoc.getId().toString())
		             .source(JSON.toJSONString(hotelDoc), XContentType.JSON);
	}
	//	 发送请求
	client.bulk(request,RequestOptions.DEFAULT);



}

用Stream+Map转换更优雅:

java 复制代码
@Test
void testBulkRequest() throws IOException {
    List<Hotel> hotels = hoteService.list();
    BulkRequest request = new BulkRequest();
    
    hotels.stream()
          .map(hotel -> new HotelDoc(hotel))
          .forEach(hotelDoc -> {
              try {
                  request.add(new IndexRequest("hotel")
                                .id(hotelDoc.getId().toString())
                                .source(JSON.toJSONString(hotelDoc), XContentType.JSON));
              } catch (IOException e) {
                  // Handle exception
                  e.printStackTrace();
              }
          });
          
    client.bulk(request, RequestOptions.DEFAULT);
}

其实是++++把多个 IndexRequest的请求合并到BulkRequest 对象里++++,然后一次性完成提交,这种就叫批处理,确实没有什么新东西, 就是把以前的那种新增的代码给它合到一起去提交了。

接下来我们就来学习第一种全文检索查询。全文检索查询它会对用户输入的内容做分词以后进行匹配。比较常见的用于这个搜索框的这种搜索

++++match和multi_match的区别是什么?一个是根据单字段查询,一个是根据多字段。而multi_match参与查询的字段越多,性能越差,建议利用copy to把多个要查的字段拷贝到一个字段当中++++

相关推荐
黎阳之光3 分钟前
黎阳之光:以原创硬核通信,定义无人系统与应急指挥新边界|7030‑46无线图数自组网电台技术解析
大数据·人工智能·物联网·算法·数字孪生
数字时代全景窗25 分钟前
DeepSeek的荣耀与Evolver的困局:中国AI创新的一体两面
大数据·人工智能·架构·软件工程
前沿科技说i2 小时前
2026年AI大模型API中转系统生产级实测:主流服务商性能与成本综合排名全指南
大数据·人工智能
Bechamz3 小时前
大数据开发学习Day41
大数据·学习
humors2213 小时前
面对暴力伤害时的自我保护指南
大数据·程序人生
2601_959477913 小时前
Vatee:从技术架构看平台运行稳定性
大数据·人工智能·安全
翼龙云_cloud3 小时前
云服务器代理商:2026 年 OpenAI 智能体平台全解析 从 GPT-5.5 到 Enterprise Agent
大数据·人工智能·gpt·云计算·ai智能体
Wils0nEdwards3 小时前
Windows本地 git 版本管理
windows·git·elasticsearch
电商API_180079052473 小时前
价格波动预警|用API实时监控淘宝京东商品价格,实现自动化竞品调价与捡漏
大数据·运维·数据库·人工智能·数据挖掘·自动化
Mangguo52083 小时前
仓储管理的“不可能三角”:如何用软件打破效率天花板?
大数据