【kettle006】kettle访问华为openGauss高斯数据库并处理数据至execl文件

1.一直以来想写下基于kettle的系列文章,作为较火的数据ETL工具,也是日常项目开发中常用的一款工具,最近刚好挤时间梳理、总结下这块儿的知识体系。

2.熟悉、梳理、总结下华为openGauss高斯数据库相关知识体系

3.欢迎批评指正,跪谢一键三连!

  • kettle访问华为openGauss高斯数据库并处理数据至execl文件文章目录索引如下所示:
  • 【实操视频,辅助实操学习,跪谢一键三连!】【kettle006】kettle访问华为openGauss高斯数据库并处理数据至execl文件

1.环境搭建、配置

  • 1.0 实验环境信息
    • Windows 10
    • CentOS 7.1(虚拟机)
    • Docker version 26.0.2
    • Dbeaver
    • Kettle 8.2
    • openGauss 2.1.0
  • 1.1 openGauss docker镜像安装
    • 如果本地有openGauss,但拉取了镜像,请调整端口信息,端口已被占用

    • 如果遇到拉取镜像很慢的问题,可以参考 https://kngines.blog.csdn.net/article/details/138142888

    • 1.1.1 操作命令

      bash 复制代码
      # 拉取opengauss镜像
      docker pull enmotech/opengauss:latest
      
      # 查看镜像
      docker image
      
      # 运行容器
      docker run --name opengauss --privileged=true -d -e GS_PASSWORD=Enmo@123 -p 8090:5432 enmotech/opengauss:latest
      
      # 查看容器
      docker ps -a
      
      docker exec -it opengauss sh
      
      # 切换用户
      su - omm
      
      # 数据库登录
      gsql
      
      # 查看数据库版本
      select version();
      
      # 查看数据库版权
      \copyright
      
      # 查看数据库
      \db
      
      # 查看所有数据库
      \l
    • 1.1.2 容器运行详情

2.openGauss高斯数据库容器链接测试

  • 2.1 驱动信息配置、测试

    • 新建 驱动管理器数据库 --》 驱动管理器 --》 新建库 --》 添加GS-DWS驱动文件

      bash 复制代码
      # 类名
      org.postgresql.Driver
      # URL 模板
      jdbc:postgresql://{host}[:{port}]/[{database}]
    • 配置详情示例图

  • 2.2 驱动包下载及配置引入

  • 2.3 DBeaver链接高斯数据库测试

    bash 复制代码
    # 默认数据库,也可新建数据库,如本文新建 youli ;注意 即使数据库名包含大写,链接配置里面配置小写
    postgres
    # 用户名
    gaussdb
    # 本实验密码
    Enmo@123
    • 链接测试配置详情
  • 2.4 建表建库测试SQL

    sql 复制代码
    create database youli owner gaussdb;
    drop database youli;
    
    create table youli_testtable (    
    	id int primary key,    
    	name varchar(100),    
    	age int,    
    	grade varchar(10)
    );
    
    delete from youli_testtable;
    insert into youli_testtable values
    (1, 'youli', 12, '1班'),
    (2, '张三', 21, '2班'),
    (3, '张三', 22, '3班'),
    (4, '张三', 23, '4班'),
    (5, '张三', 13, '5班'),
    (6, '张三', 14, '6班'),
    (7, '张三', 15, '7班'),
    (8, '张三', 13, '8班'),
    (9, '张三', 16, '9班'),
    (10, '张三', 19, '10班');
    
    select * from youli_testtable;

3.kettle流程任务配置、效果验证

  • 3.1 将2.2下载的高斯数据库相应版本驱动包放到 kettlle lib 目录下,重启 kettle,进行链接测试
  • 3.2 kettle链接高斯数据库容器环境测试结果

4.参考文章

相关推荐
絆人心1 天前
Python 数据分析核心库:Pandas 与 NumPy 从入门到实战全指南(附电商用户分析完整代码)
python·数据挖掘·数据分析·numpy·pandas·数据处理·电商数据分析
heimeiyingwang2 天前
【架构实战】ETL架构演进:从批处理到实时流处理
数据仓库·架构·etl
素玥2 天前
实训4 ETL构建中间层
数据仓库·etl
苛子2 天前
ETL与ELT的区别与选择:企业数据集成方案深度对比
数据仓库·etl
GIS地信小匠2 天前
(26)ArcGIS Pro 面要素叠加编辑:更新与交集取反工具实操全解
arcgis·空间分析·数据处理·gis教程·arcgls pro
清水白石0082 天前
Python 日志采集到数据仓库 ETL 流程设计实战:从基础语法到生产级可靠运维
数据仓库·python·etl
GIS地信小匠3 天前
(21)ArcGIS Pro 矢量拆分与相交分析:按属性 / 位置拆分 + 重叠提取全攻略
arcgis·空间分析·数据处理·gis教程·arcgls pro
GIS地信小匠3 天前
(25)ArcGIS Pro 要素字段融合、分配面:面要素空间编辑攻略
arcgis·空间分析·数据处理·gis教程·arcgls pro
IOFsmLtzR4 天前
cursor cli 执行 ETL 数据同步任务探索
数据仓库·etl
GIS地信小匠5 天前
(22)ArcGIS Pro 联合与标识分析:全范围合并、属性标记,空间叠加双核心工具
arcgis·空间分析·数据处理·gis教程·arcgls pro