Spark任务读取hive表数据导入es

使用elasticsearch-hadoop 将hive表数据导入es,超级简单

1.引入pom

XML 复制代码
<dependency>
  <groupId>org.elasticsearch</groupId>
  <artifactId>elasticsearch-hadoop</artifactId>
  <version>9.0.0-SNAPSHOT</version>
</dependency>
  1. 创建sparkconf
java 复制代码
// spark 参数设置
SparkConf sparkConf = new SparkConf();
//要写入的索引
sparkConf.set("es.resource","");
//es集群地址,不用全部配置会自动发现
sparkConf.set("es.nodes","");
sparkConf.set("es.mapping.id","c1");
sparkConf.set("es.net.http.auth.user","");//用户名
sparkConf.set("es.net.http.auth.pass","");//密码

SparkSession sparkSession = SparkSession.builder().config(sparkConf).enableHiveSupport()
                .getOrCreate();
  1. 写入es
java 复制代码
        Dataset<Row> dataSet = sparkSession.sql("select c1,c2,c3 from xx");
        JavaEsSparkSQL.saveToEs(dataSet, ImmutableMap.of());

sql读取的字段需要与es字段名一一对应

相关推荐
BaiZhuYuan7 分钟前
io流(学习笔记01)--File知识点
java·开发语言
Annuo、8 分钟前
php中根据指定日期获取所在天,周,月,年的开始日期与结束日期
java·服务器·前端
森屿Serien28 分钟前
jvm 内存结构
java·jvm
zheeez32 分钟前
JVM 基本组成
java·jvm
小大力38 分钟前
简单的spring缓存 Cacheable学习
java·redis·缓存
OEC小胖胖1 小时前
Spring MVC系统学习(一)——初识Spring MVC框架
java·后端·学习·spring·mvc
超级小的大杯柠檬水1 小时前
Spring Boot文件上传
java·spring boot·后端
hongyuxiongji1 小时前
java8 缓存对比并存值
java
coder what1 小时前
基于springoot新能源充电系统的设计与实现
java·spring boot·后端·新能源充电系统
陈吉俊2 小时前
spark 广播和累加器
大数据·分布式·spark