修炼离线:(二)sqoop插入hbase 脚本(增量)

一:mysql创建表,插入数据。

二:hbase创建表。

sql 复制代码
habse shell
create 'aa'(表名),'cf'(列族)

三:mysql_hbase脚本。

sql 复制代码
#!/bin/sh

mysqlHost=$1
mysqlUserName=$2
mysqlUserPass=$3
mysqlDbName=$4
myqlTbName=$5
hbaseTbName=$6
hbaseTbRowkey=$7
hbaseTbRowfamily=$8
mysqlUpdateField=$9
lastMonthDealDate=${10}
p_dt=${11}

echo ${mysqlHost}
echo ${mysqlUserName}
echo ${mysqlUserPass}
echo ${mysqlDbName}
echo ${myqlTbName}
echo ${hbaseTbName}
echo ${hbaseTbRowkey}
echo ${hbaseTbRowfamily}
echo ${mysqlUpdateField}
echo ${lastMonthDealDate}
echo ${p_dt}


sqoop import "-Dorg.apache.sqoop.splitter.allow_text_splitter=true" \
"-Dsqoop.hbase.add.row.key=true"  \
--connect jdbc:mysql://${mysqlHost}/${mysqlDbName} \
--username ${mysqlUserName} \
--password ${mysqlUserPass} \
--table ${myqlTbName} \
--hbase-table ${hbaseTbName} \
--hbase-row-key ${hbaseTbRowkey} \
--column-family ${hbaseTbRowfamily} \
--where "date_format(${mysqlUpdateField},'%Y-%m-%d') between '${lastMonthDealDate}' and '${p_dt}'"

#--num-mappers 16

四:shell脚本。

sql 复制代码
sh mysql_hbase.sh 27.155.84.54 root 123456 aaa(mysql库名) bbb(mysql表名)  MANUFACTURER,BLE_ID(hbase的rowkey) cf(hbase列族) edit_time(mysql更新字段) 2021-09-01(开始日期) 2023-09-19(结束日期)
相关推荐
Matrix708 小时前
HBase理论_HBase架构组件介绍
大数据·数据库·hbase
不太灵光的程序员8 小时前
【HBase分布式数据库】第七章 数据的导入导出 importtsv导入数据
数据库·分布式·hbase
Mephisto.java8 小时前
【大数据学习 | HBASE高级】region split机制和策略
数据库·学习·hbase
Mephisto.java1 天前
【大数据学习 | HBASE】hbase的读数据流程与hbase读取数据
大数据·学习·hbase
Matrix701 天前
HBase理论_背景特点及数据单元及与Hive对比
大数据·数据库·hbase
Mephisto.java1 天前
【大数据学习 | HBASE高级】hive操作hbase
大数据·hbase
Mephisto.java2 天前
【大数据学习 | HBASE高级】rowkey的设计,hbase的预分区和压缩
大数据·sql·mysql·json·hbase·database
Mephisto.java2 天前
【大数据学习 | HBASE高级】hbase的API操作
大数据·学习·hbase
三劫散仙3 天前
Hadoop + Hive + Apache Ranger 源码编译记录
hive·hadoop·hbase·ranger
dogplays3 天前
sqoop import将Oracle数据加载至hive,数据量变少,只能导入一个mapper的数据量
hive·oracle·sqoop