使用datax通过HbaseShell封装_同步hbase数据到瀚高数据库highgo_踩坑_细节总结---大数据之DataX工作笔记009

复制代码
{
    "job": {
        "setting": {
            "speed": {
                "channel": 3, 
                "byte": 1048576
            }, 
            "errorLimit": {
                "record": 0, 
                "percentage": 0.02
            }
        }, 
        "content": [
            {
                "reader": {
                    "name": "hbase11xreader", 
                    "parameter": {
                        "hbaseConfig": {
                            "hbase.zookeeper.quorum": "172.19.126.120,172.19.126.121,172.19.126.122:2181"
                        }, 
                        "table": "userinfoshell", 
                        "mode": "normal", 
                        "column": [
 	         	{
                               "name": "rowkey", 
                                "type": "string"
                            }, 
                            {
                                "name": "info:addr", 
                                "type": "string"
                            }, 
                            {
                                "name": "info:son_json", 
                                "type": "string"
                            }, 
                            {
                                "name": "info:mobile", 
                                "type": "string"
                            }, 
                            {
                                "name": "info:name", 
                                "type": "string"
                            }, 
                            {
                                "name": "info:email", 
                                "type": "string"
                            }
                        ]
                    }
                }, 
                "writer": {
                    "name": "mysqlwriter", 
                    "parameter": {
                        "username": "0uADFAaASDASDFASDmOA==", 
                        "password": "niVbuSDSESEFSDSdA==", 
                        "column": [
                            "id", 
		    "addr",
                            "son_json", 
                            "mobile", 
                            "name", 
                            "email"
                        ], 
                        "connection": [
                            {
                                "table": [
                                    "dzrb_bigdata_huiju.user_info"
                                ], 
                                "jdbcUrl": "jdbc:highgo://172.19.126.125:5866/datS_bigdata_cloud"
                            }
                        ]
                    }
                }
            }
        ]
    }, 
    "core": {
        "transport": {
            "channel": {
                "speed": {
                    "byte": 1231412
                }
            }
        }
    }
}

给出一个可以运行的json 用来把hbase同步到瀚高的,有了这个json就好多了.

可以看到,对应的,字段对应关系是可以直接对应起来的,不用字段名字一样,就是说,

hbase中写了比如info:name,info:age ,其实对应的瀚高中可以写成column[id,addr]

这样就相当于把name传入到id中,把ageaddr

然后就可以去使用datax-web去跑一下试试了.

相关推荐
G皮T1 小时前
【Elasticsearch】正排索引、倒排索引(含实战案例)
大数据·elasticsearch·搜索引擎·kibana·倒排索引·搜索·正排索引
小葛呀3 小时前
互联网大数据求职面试:从Zookeeper到数据挖掘的技术探讨
大数据·redis·zookeeper·面试·互联网·数据采集·技术栈
T06205144 小时前
【面板数据】A股上市公司注册地所在地数据集(1991-2023年)
大数据
zh_199955 小时前
Spark面试精讲(上)
java·大数据·数据仓库·python·spark·数据库开发·数据库架构
淡酒交魂6 小时前
「Flink」Flink项目搭建方法介绍
大数据·数据挖掘·数据分析
袋鼠云数栈6 小时前
当空间与数据联动,会展中心如何打造智慧运营新范式?
大数据·人工智能·信息可视化
Python当打之年6 小时前
【62 Pandas+Pyecharts | 智联招聘大数据岗位数据分析可视化】
大数据·python·数据分析·pandas·数据可视化
G皮T7 小时前
【Elasticsearch】Elasticsearch 近实时高速查询原理
大数据·elasticsearch·搜索引擎·全文检索·倒排索引·搜索·nrt
白总Server7 小时前
Golang dig框架与GraphQL的完美结合
java·大数据·前端·javascript·后端·go·graphql
Aurora_NeAr8 小时前
Spark RDD 及性能调优
大数据·后端·spark