Spark任务读取hive表数据导入es

使用elasticsearch-hadoop 将hive表数据导入es,超级简单

1.引入pom

XML 复制代码
<dependency>
  <groupId>org.elasticsearch</groupId>
  <artifactId>elasticsearch-hadoop</artifactId>
  <version>9.0.0-SNAPSHOT</version>
</dependency>
  1. 创建sparkconf
java 复制代码
// spark 参数设置
SparkConf sparkConf = new SparkConf();
//要写入的索引
sparkConf.set("es.resource","");
//es集群地址,不用全部配置会自动发现
sparkConf.set("es.nodes","");
sparkConf.set("es.mapping.id","c1");
sparkConf.set("es.net.http.auth.user","");//用户名
sparkConf.set("es.net.http.auth.pass","");//密码

SparkSession sparkSession = SparkSession.builder().config(sparkConf).enableHiveSupport()
                .getOrCreate();
  1. 写入es
java 复制代码
        Dataset<Row> dataSet = sparkSession.sql("select c1,c2,c3 from xx");
        JavaEsSparkSQL.saveToEs(dataSet, ImmutableMap.of());

sql读取的字段需要与es字段名一一对应

相关推荐
iNgs IMAC16 分钟前
Redis之Redis事务
java·数据库·redis
程序员小假24 分钟前
向量检索的流程是怎样的?Embedding 和 Rerank 各自的作用?
java·后端
看海的四叔33 分钟前
【SQL】SQL同环比计算的多种实现方式
数据库·hive·sql·mysql·数据分析·同环比
yaaakaaang42 分钟前
二十二、模板方法模式
java·模板方法模式
Wmenghu43 分钟前
Ubuntu手动安装jdk;Ubuntu手动安装Maven;Ubuntu手动安装RocketMQ;Ubuntu手动安装RocketMQ-Dashbo
java·linux·ubuntu
后置的猿猴44 分钟前
Spring 循环依赖
java·后端·spring
SeSs IZED1 小时前
SSM与Springboot是什么关系? -----区别与联系
java·spring boot·后端
橙子199110161 小时前
Java 基础相关
java·开发语言
勿忘,瞬间1 小时前
SpringBoot配置文件
java·spring boot·后端
fTiN CAPA1 小时前
Tomcat 都有哪些核心组件
java·tomcat·firefox