Flink整合Hudi及使用

1、jar包上传

上传jar包即可完成整合

bash 复制代码
# 1、将hudi-flink1.15-bundle-0.15.0.jar包上传到flink的lib目录下
/usr/local/soft/flink-1.15.3/lib

-- 如果没有启动集群,直接忽略
#  2、重启flink的集群
yarn application -list
yarn application -kill application_1706339492248_0003
yarn-session.sh -d

# 重启命令行
sql-client.sh

2、使用

sql 复制代码
-- 创建表
CREATE TABLE students_hudi(
    id STRING PRIMARY KEY NOT ENFORCED,
    name STRING,
    age INT,
    sex STRING,
    clazz STRING
)
PARTITIONED BY (clazz)
WITH (
  'connector' = 'hudi',
  'path' = 'hdfs://master:8020/data/hudi/students',
  'table.type' = 'MERGE_ON_READ'
);

-- 插入数据
insert into students_hudi
values('1500100003','施小还',23,'女','文科六班');
相关推荐
CS_浮鱼12 分钟前
【Linux】进程控制
linux·运维·网络
Miraitowa_cheems24 分钟前
LeetCode算法日记 - Day 104: 通配符匹配
linux·数据结构·算法·leetcode·深度优先·动态规划
fengyehongWorld29 分钟前
Linux stat命令
linux
人工智能训练1 小时前
Docker中容器的备份方法和步骤
linux·运维·人工智能·ubuntu·docker·容器·nvidia
渡我白衣1 小时前
深入 Linux 内核启动:从按下电源到用户登录的全景解剖
java·linux·运维·服务器·开发语言·c++·人工智能
代码炼金术士1 小时前
linux的nginx版本升级
linux·运维·nginx
atsec1 小时前
atsec完成Newland NPT的P2PE PA评估
服务器·网络协议·npt·p2pe
讨厌下雨的天空2 小时前
进程优先级
linux·服务器
大柏怎么被偷了2 小时前
【Linux】版本控制器git
linux·运维·服务器
JiMoKuangXiangQu2 小时前
busybox:启动阶段的静态 IP 配置过程
linux·busybox·静态ip配置