Flink整合Hudi及使用

1、jar包上传

上传jar包即可完成整合

bash 复制代码
# 1、将hudi-flink1.15-bundle-0.15.0.jar包上传到flink的lib目录下
/usr/local/soft/flink-1.15.3/lib

-- 如果没有启动集群,直接忽略
#  2、重启flink的集群
yarn application -list
yarn application -kill application_1706339492248_0003
yarn-session.sh -d

# 重启命令行
sql-client.sh

2、使用

sql 复制代码
-- 创建表
CREATE TABLE students_hudi(
    id STRING PRIMARY KEY NOT ENFORCED,
    name STRING,
    age INT,
    sex STRING,
    clazz STRING
)
PARTITIONED BY (clazz)
WITH (
  'connector' = 'hudi',
  'path' = 'hdfs://master:8020/data/hudi/students',
  'table.type' = 'MERGE_ON_READ'
);

-- 插入数据
insert into students_hudi
values('1500100003','施小还',23,'女','文科六班');
相关推荐
不会代码的小猴27 分钟前
Linux环境编程第六天笔记--system-V IPC
linux·笔记
阳光九叶草LXGZXJ31 分钟前
达梦数据库-学习-48-DmDrs控制台命令(同步之Manager、CPT模块)
linux·运维·数据库·sql·学习
诸神缄默不语34 分钟前
Linux命令行教程
linux
小二李2 小时前
第11章 nestjs服务端开发:登录鉴权
运维·服务器
i建模3 小时前
如何在Arch Linux中重设忘记的root密码
linux·运维·服务器
kida_yuan4 小时前
【Linux】运维实战笔记 — 我常用的方法与命令
linux·运维·笔记
@syh.4 小时前
【linux】进程控制
linux
何中应6 小时前
vmware的linux虚拟机如何设置以命令行方式启动
linux·运维·服务器
野犬寒鸦6 小时前
从零起步学习并发编程 || 第一章:初步认识进程与线程
java·服务器·后端·学习
江畔何人初6 小时前
kubernet与docker的关系
linux·运维·云原生