数据仓库(Data Warehouse)建设的流程[web业务交互之外部分]

1.下载安装VMware

  1. CentOS创建虚拟机

3.选择NAT模式进行网络配置

4.远程终端工具进行安装,Xshell和Xftp

5.虚拟机环境准备

6.克隆虚拟机

7.在第二台虚拟机安装jdk

8.在第二台虚拟机安装Hadoop

9.使用完全分布式运行模式

10.编写集群分发脚本 xsync

11.SSH 无密登录配置

12.集群配置

13.配置历史服务器

14.配置日志的聚集

15.Zookeeper 集群操作

16.Hadoop 集群离线安装 mysql

17.Hadoop 集群安装 hive

18.Sqoop 安装与配置

19.将mysql的数据导入hive当中并创建 ODS层

20.DWD数据采集模块

21.数仓搭建-DWS层

22.指标选取

23.创建ADS层并创建临时表,方便后续导入到mysql当中

24.mysql建表并导入数据

26.离线可视化

相关推荐
vvilkim2 小时前
Java主流框架全解析:从企业级开发到云原生
java·运维·云原生
Wy_编程6 小时前
Linux-文本搜索工具grep
linux·运维·服务器
qq998996 小时前
AAA服务器技术
运维·服务器
xujiangyan_6 小时前
linux的sysctl系统以及systemd系统。
linux·服务器·网络
Lovyk6 小时前
Linux Shell 常用操作与脚本示例详解
linux·运维·服务器
iCan_qi7 小时前
【Mac】【Minecraft】关于如何在Mac上搭建基岩版MC服务器的方法
运维·服务器·macos·minecraft
ezreal_pan9 小时前
Kubernetes 负载均衡现象解析:为何同一批次请求集中于单个 Pod
运维·云原生·k8s·traefik
朱皮皮呀9 小时前
Spring Cloud——服务注册与服务发现原理与实现
运维·spring cloud·eureka·服务发现·php
xixingzhe29 小时前
多人同时导出 Excel 导致内存溢出
服务器·设计
云手机掌柜10 小时前
Tumblr长文运营:亚矩阵云手机助力多账号轮询与关键词布局系统
大数据·服务器·tcp/ip·矩阵·流量运营·虚幻·云手机