Flink整合Hudi及使用

1、jar包上传

上传jar包即可完成整合

bash 复制代码
# 1、将hudi-flink1.15-bundle-0.15.0.jar包上传到flink的lib目录下
/usr/local/soft/flink-1.15.3/lib

-- 如果没有启动集群,直接忽略
#  2、重启flink的集群
yarn application -list
yarn application -kill application_1706339492248_0003
yarn-session.sh -d

# 重启命令行
sql-client.sh

2、使用

sql 复制代码
-- 创建表
CREATE TABLE students_hudi(
    id STRING PRIMARY KEY NOT ENFORCED,
    name STRING,
    age INT,
    sex STRING,
    clazz STRING
)
PARTITIONED BY (clazz)
WITH (
  'connector' = 'hudi',
  'path' = 'hdfs://master:8020/data/hudi/students',
  'table.type' = 'MERGE_ON_READ'
);

-- 插入数据
insert into students_hudi
values('1500100003','施小还',23,'女','文科六班');
相关推荐
REDcker33 分钟前
DNS技术详解
服务器·后端·计算机网络·互联网·dns·服务端
上海合宙LuatOS33 分钟前
LuatOS核心库API——【io】 io操作(扩展)
java·服务器·前端·网络·单片机·嵌入式硬件·物联网
能源革命3 小时前
Ubuntu_24.04 安装OpenClaw教程
linux·ubuntu
laocui14 小时前
树莓派Ubuntu系统安装openclow(豆包+QQ机器人)
linux·运维·ubuntu
qq_24218863325 小时前
快速搭建跨环境检测服务的步骤
linux·开发语言·windows·python·macos
月明长歌5 小时前
Java 网络编程套接字入门:从“发一段数据”到“写一个可并发的服务器”
java·服务器·网络
冗量5 小时前
《性能之巅》第七章:内存 读书笔记
服务器·性能优化·性能调优
Trouvaille ~5 小时前
【Linux】网络进阶:NAT技术与代理服务器详解
linux·运维·网络·nginx·ip·nat·代理服务器
Codefengfeng5 小时前
binwalk提取文件时无输出文件夹(kali-linux环境)
linux·运维·服务器
好好学习天天向上~~6 小时前
11_Linux学习总结_环境变量
linux·学习