Spark任务读取hive表数据导入es

使用elasticsearch-hadoop 将hive表数据导入es,超级简单

1.引入pom

XML 复制代码
<dependency>
  <groupId>org.elasticsearch</groupId>
  <artifactId>elasticsearch-hadoop</artifactId>
  <version>9.0.0-SNAPSHOT</version>
</dependency>
  1. 创建sparkconf
java 复制代码
// spark 参数设置
SparkConf sparkConf = new SparkConf();
//要写入的索引
sparkConf.set("es.resource","");
//es集群地址,不用全部配置会自动发现
sparkConf.set("es.nodes","");
sparkConf.set("es.mapping.id","c1");
sparkConf.set("es.net.http.auth.user","");//用户名
sparkConf.set("es.net.http.auth.pass","");//密码

SparkSession sparkSession = SparkSession.builder().config(sparkConf).enableHiveSupport()
                .getOrCreate();
  1. 写入es
java 复制代码
        Dataset<Row> dataSet = sparkSession.sql("select c1,c2,c3 from xx");
        JavaEsSparkSQL.saveToEs(dataSet, ImmutableMap.of());

sql读取的字段需要与es字段名一一对应

相关推荐
无限进步_13 小时前
【C++】可变参数模板与emplace系列
java·c++·算法
逐光老顽童13 小时前
Java 内存模型深度解析与 JVM 调优实战指南
java·架构
写了20年代码的老程序员13 小时前
Excel 导入导出为什么总是把后端逼成字段搬运工
java·excel
ChoSeitaku13 小时前
10.枚举_Record_密封类_debug_API文档_Object类_lombok_Junit
java·数据库·junit
zhoumeina9913 小时前
如何保证不同位置切换合成底图的渲染顺序
java·前端·javascript
欢璃13 小时前
笔试强训练习
java·开发语言·jvm·数据结构·算法·贪心算法·动态规划
Dicky-_-zhang14 小时前
Go语言内存管理与GC机制深度解析
java·jvm
白鲸开源14 小时前
干货!SeaTunnel(2.3.12)高阶用法(一):核心概念之数据流
java·大数据·github
夜白宋14 小时前
【项目深入】二、秒杀系统
java
花开·莫之弃14 小时前
Mac安装多版本jdk(jenv)
java·开发语言·macos