Flume采集Kafka数据到Hive

yangjiwei02072024-10-30 13:25

版本：

Kafka：2.4.1

Flume：1.9.0

Hive：3.1.0

Kafka主题准备：

Hive表准备：确保hive表为：分区分桶、orc存储、开启事务

Flume准备：

配置flume文件：

/opt/datasophon/flume-1.9.0/conf/kafka2hive.conf

需要将hive的jar包同步到flume的lib目录下：

/opt/datasophon/hive-3.1.0/hcatalog/share/hcatalog/hive-hcatalog-streaming-3.1.0.jar

切换到flume的bin目录下，运行配置文件

启动Kafka写入数据

监控flume页面情况

去hive数据表进行数据查看，数据成功同步过来。

上一篇：Kafka 基础入门

下一篇：八、MapReduce 大规模数据处理深度剖析与实战指南

热门推荐

01GitHub 镜像站点 02UV安装并设置国内源 03综合整理：pdf预览显示：你尝试预览的文件可能对你的计算机有害。如果你信任此文件以及其来源，请打开此文件以看其内容，如何解决以正常预览文件 04Linux下V2Ray安装配置指南 05BongoCat - 跨平台键盘猫动画工具 06安娜的档案(Anna’s Archive) 镜像网站/国内最新可访问入口（持续更新）07npm使用国内淘宝镜像的方法 08jdk21下载、安装（Windows、Linux、macOS）09《大数据技术原理与应用》实验报告三熟悉HBase常用操作 10PyCharm 社区版全平台安装指南