kettle_Hbase

难以触及的高度2024-06-15 20:13

kettle_Hbase

☀Hbase学习笔记

读取hdfs文件并将sal大于1000的数据保存到hbase中

前置说明：

1.需要配置HadoopConnect 将集群中的/usr/local/soft/hbase-1.4.6/conf/hbase-site.xml复制至Kettle中的

Kettle\pdi-ce-8.2.0.0-342\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\hdp26目录中

2.配置Hadoop Cluster 中Zookeeper的Hostname为master,port为2181

1、在HBase中创建一张people表

复制代码

hbase(main):004:0> create 'people','info'

2、按下图建立流程图

文本文件输入

设置过滤记录

设置HBase output

编辑hadoop连接，并配置zookeeper地址

执行转换

查看hbase people表的数据
复制代码
```
scan 'people'
```
注意：若报错没有权限往hdfs写文件，在Spoon.bat中第119行添加参数

"-DHADOOP_USER_NAME=root" "-Dfile.encoding=UTF-8"

上一篇：【Go】爬虫数据解密_使用Go语言实现TripleDES加密和解密

下一篇：富格林：力争打破黑幕安全盈利

热门推荐

01GitHub 镜像站点 02UV安装并设置国内源 03BongoCat - 跨平台键盘猫动画工具 04《大数据技术原理与应用》实验报告三熟悉HBase常用操作 05Linux下V2Ray安装配置指南 06安娜的档案(Anna’s Archive) 镜像网站/国内最新可访问入口（持续更新）07NVIDIA显卡驱动、CUDA、cuDNN 和 TensorRT 版本匹配指南 08GitLab 零基础入门指南：从安装到项目管理全流程 09jdk21下载、安装（Windows、Linux、macOS）10在VSCode配置Java开发环境的保姆级教程（适配各类AI编程IDE）