【kettle006】kettle访问华为openGauss高斯数据库并处理数据至execl文件

1.一直以来想写下基于kettle的系列文章,作为较火的数据ETL工具,也是日常项目开发中常用的一款工具,最近刚好挤时间梳理、总结下这块儿的知识体系。

2.熟悉、梳理、总结下华为openGauss高斯数据库相关知识体系

3.欢迎批评指正,跪谢一键三连!

  • kettle访问华为openGauss高斯数据库并处理数据至execl文件文章目录索引如下所示:
  • 【实操视频,辅助实操学习,跪谢一键三连!】【kettle006】kettle访问华为openGauss高斯数据库并处理数据至execl文件

1.环境搭建、配置

  • 1.0 实验环境信息
    • Windows 10
    • CentOS 7.1(虚拟机)
    • Docker version 26.0.2
    • Dbeaver
    • Kettle 8.2
    • openGauss 2.1.0
  • 1.1 openGauss docker镜像安装
    • 如果本地有openGauss,但拉取了镜像,请调整端口信息,端口已被占用

    • 如果遇到拉取镜像很慢的问题,可以参考 https://kngines.blog.csdn.net/article/details/138142888

    • 1.1.1 操作命令

      bash 复制代码
      # 拉取opengauss镜像
      docker pull enmotech/opengauss:latest
      
      # 查看镜像
      docker image
      
      # 运行容器
      docker run --name opengauss --privileged=true -d -e GS_PASSWORD=Enmo@123 -p 8090:5432 enmotech/opengauss:latest
      
      # 查看容器
      docker ps -a
      
      docker exec -it opengauss sh
      
      # 切换用户
      su - omm
      
      # 数据库登录
      gsql
      
      # 查看数据库版本
      select version();
      
      # 查看数据库版权
      \copyright
      
      # 查看数据库
      \db
      
      # 查看所有数据库
      \l
    • 1.1.2 容器运行详情

2.openGauss高斯数据库容器链接测试

  • 2.1 驱动信息配置、测试

    • 新建 驱动管理器数据库 --》 驱动管理器 --》 新建库 --》 添加GS-DWS驱动文件

      bash 复制代码
      # 类名
      org.postgresql.Driver
      # URL 模板
      jdbc:postgresql://{host}[:{port}]/[{database}]
    • 配置详情示例图

  • 2.2 驱动包下载及配置引入

  • 2.3 DBeaver链接高斯数据库测试

    bash 复制代码
    # 默认数据库,也可新建数据库,如本文新建 youli ;注意 即使数据库名包含大写,链接配置里面配置小写
    postgres
    # 用户名
    gaussdb
    # 本实验密码
    Enmo@123
    • 链接测试配置详情
  • 2.4 建表建库测试SQL

    sql 复制代码
    create database youli owner gaussdb;
    drop database youli;
    
    create table youli_testtable (    
    	id int primary key,    
    	name varchar(100),    
    	age int,    
    	grade varchar(10)
    );
    
    delete from youli_testtable;
    insert into youli_testtable values
    (1, 'youli', 12, '1班'),
    (2, '张三', 21, '2班'),
    (3, '张三', 22, '3班'),
    (4, '张三', 23, '4班'),
    (5, '张三', 13, '5班'),
    (6, '张三', 14, '6班'),
    (7, '张三', 15, '7班'),
    (8, '张三', 13, '8班'),
    (9, '张三', 16, '9班'),
    (10, '张三', 19, '10班');
    
    select * from youli_testtable;

3.kettle流程任务配置、效果验证

  • 3.1 将2.2下载的高斯数据库相应版本驱动包放到 kettlle lib 目录下,重启 kettle,进行链接测试
  • 3.2 kettle链接高斯数据库容器环境测试结果

4.参考文章

相关推荐
m0_748254883 天前
DataX3.0+DataX-Web部署分布式可视化ETL系统
前端·分布式·etl
不会写代码的女程序猿4 天前
关于ETL的两种架构(ETL架构和ELT架构)
数据仓库·架构·etl
故苏呦5 天前
全域数据集成平台ETL
数据仓库·etl
天地风雷水火山泽7 天前
二百八十、ClickHouse——用Kettle对DWD层补全的清洗数据进行记录
大数据·clickhouse·kettle
靠谱杨9 天前
CDA LEVEL 1新大纲2023添加的内容
大数据·数据仓库·面试·职场和发展·跳槽·etl·etl工程师
PersistJiao12 天前
调度系统:分析 Apache Airflow 和 Prefect 在 基于Couchbase构建数据仓库 和 ETL任务调度 的场景下,哪一个更合适
数据仓库·apache·etl
脸ル粉嘟嘟12 天前
Oracle之自动化部署etl程序
oracle·自动化·etl
焚琴煮鹤的熊熊野火13 天前
数据仓库实验一 建立警务数据仓库完成ETL
数据仓库·etl
梦想画家16 天前
Tablesaw封装Plot.ly实现数据可视化
数据可视化·数据处理·tablesaw
weixin_3077791317 天前
在AWS EMR上用Hive、Spark、Airflow构建一个高效的ETL程序
hive·spark·云计算·etl·aws