Flink整合Hudi及使用

1、jar包上传

上传jar包即可完成整合

bash 复制代码
# 1、将hudi-flink1.15-bundle-0.15.0.jar包上传到flink的lib目录下
/usr/local/soft/flink-1.15.3/lib

-- 如果没有启动集群,直接忽略
#  2、重启flink的集群
yarn application -list
yarn application -kill application_1706339492248_0003
yarn-session.sh -d

# 重启命令行
sql-client.sh

2、使用

sql 复制代码
-- 创建表
CREATE TABLE students_hudi(
    id STRING PRIMARY KEY NOT ENFORCED,
    name STRING,
    age INT,
    sex STRING,
    clazz STRING
)
PARTITIONED BY (clazz)
WITH (
  'connector' = 'hudi',
  'path' = 'hdfs://master:8020/data/hudi/students',
  'table.type' = 'MERGE_ON_READ'
);

-- 插入数据
insert into students_hudi
values('1500100003','施小还',23,'女','文科六班');
相关推荐
zincsweet9 分钟前
C++ 实现进程池:主从架构、管道通信与任务调度
linux·c++
草莓熊Lotso15 分钟前
【CMake】静态库的编译、链接与引用全解析
linux·c语言·数据库·c++·软件工程·cmake
原来是猿15 分钟前
性能测试(1)
运维·服务器·python·压力测试
郝学胜-神的一滴16 分钟前
CMake 012:Linux 下动态库与可执行程序的单文件构建
linux·服务器·开发语言·c++·软件构建·cmake
为思念酝酿的痛9 小时前
POSIX信号量
linux·运维·服务器·后端
隔窗听雨眠10 小时前
Nginx网关响应慢排查手记
java·服务器·nginx
阿坤带你走近大数据10 小时前
Paimon相关概念的介绍
flink·数据湖·paimon
人还是要有梦想的10 小时前
linux下用搜狗输入法,中英文切换
linux·运维·服务器
bush410 小时前
嵌入式linux学习记录二
linux·运维·学习
9分钟带帽10 小时前
linux_通过NFS挂载远程服务器的硬盘
linux·服务器