数据仓库(Data Warehouse)建设的流程[web业务交互之外部分]

1.下载安装VMware

  1. CentOS创建虚拟机

3.选择NAT模式进行网络配置

4.远程终端工具进行安装,Xshell和Xftp

5.虚拟机环境准备

6.克隆虚拟机

7.在第二台虚拟机安装jdk

8.在第二台虚拟机安装Hadoop

9.使用完全分布式运行模式

10.编写集群分发脚本 xsync

11.SSH 无密登录配置

12.集群配置

13.配置历史服务器

14.配置日志的聚集

15.Zookeeper 集群操作

16.Hadoop 集群离线安装 mysql

17.Hadoop 集群安装 hive

18.Sqoop 安装与配置

19.将mysql的数据导入hive当中并创建 ODS层

20.DWD数据采集模块

21.数仓搭建-DWS层

22.指标选取

23.创建ADS层并创建临时表,方便后续导入到mysql当中

24.mysql建表并导入数据

26.离线可视化

相关推荐
widder_2 分钟前
软考中级软件设计师——操作系统篇
运维·服务器·数据库
lizz3122 分钟前
离线服务器Python环境配置指南
运维·服务器·python
Dontla38 分钟前
服务器网络配置 netplan一个网口配置两个ip(双ip、辅助ip、别名IP别名)
服务器·网络·tcp/ip
浩浩测试一下1 小时前
红蓝对抗中的网络安全设备操作手册
运维·服务器·网络
feing.1 小时前
防火墙高可靠性
linux·服务器·网络
苒苒鸭1 小时前
远程连接的公私钥加密
linux
破刺不会编程1 小时前
Linux中进程控制(上)
linux·运维·服务器·开发语言·windows
渡我白衣1 小时前
Linux操作系统之进程(二):进程状态
linux
仙袂拂月1 小时前
Day 0014:信息收集工具链
linux·运维·服务器·笔记·网络安全
知北游天2 小时前
Linux:进程信号---信号的保存与处理
linux·运维·服务器