数据仓库(Data Warehouse)建设的流程[web业务交互之外部分]

1.下载安装VMware

  1. CentOS创建虚拟机

3.选择NAT模式进行网络配置

4.远程终端工具进行安装,Xshell和Xftp

5.虚拟机环境准备

6.克隆虚拟机

7.在第二台虚拟机安装jdk

8.在第二台虚拟机安装Hadoop

9.使用完全分布式运行模式

10.编写集群分发脚本 xsync

11.SSH 无密登录配置

12.集群配置

13.配置历史服务器

14.配置日志的聚集

15.Zookeeper 集群操作

16.Hadoop 集群离线安装 mysql

17.Hadoop 集群安装 hive

18.Sqoop 安装与配置

19.将mysql的数据导入hive当中并创建 ODS层

20.DWD数据采集模块

21.数仓搭建-DWS层

22.指标选取

23.创建ADS层并创建临时表,方便后续导入到mysql当中

24.mysql建表并导入数据

26.离线可视化

相关推荐
invicinble1 小时前
对linux形成认识
linux·运维·服务器
小Pawn爷1 小时前
14.VMmare安装ubuntu
linux·运维·ubuntu
技术路上的探险家1 小时前
8 卡 V100 服务器:基于 vLLM 的 Qwen 大模型高效部署实战
运维·服务器·语言模型
有谁看见我的剑了?1 小时前
介绍一款 测试 DNS解析成功率的网站
运维
半桔1 小时前
【IO多路转接】高并发服务器实战:Reactor 框架与 Epoll 机制的封装与设计逻辑
linux·运维·服务器·c++·io
绵绵细雨中的乡音1 小时前
深入理解 ET 与 LT 模式及其在 Reactor 模型中的应用
服务器·网络·php
HABuo2 小时前
【linux文件系统】磁盘结构&文件系统详谈
linux·运维·服务器·c语言·c++·ubuntu·centos
Howrun7772 小时前
关于Linux服务器的协作问题
linux·运维·服务器
小白同学_C3 小时前
Lab3-page tables && MIT6.1810操作系统工程【持续更新】
linux·c/c++·操作系统os
十年磨一剑~4 小时前
Linux程序接收到sigpipe信号崩溃处理
linux