数据仓库(Data Warehouse)建设的流程[web业务交互之外部分]

1.下载安装VMware

  1. CentOS创建虚拟机

3.选择NAT模式进行网络配置

4.远程终端工具进行安装,Xshell和Xftp

5.虚拟机环境准备

6.克隆虚拟机

7.在第二台虚拟机安装jdk

8.在第二台虚拟机安装Hadoop

9.使用完全分布式运行模式

10.编写集群分发脚本 xsync

11.SSH 无密登录配置

12.集群配置

13.配置历史服务器

14.配置日志的聚集

15.Zookeeper 集群操作

16.Hadoop 集群离线安装 mysql

17.Hadoop 集群安装 hive

18.Sqoop 安装与配置

19.将mysql的数据导入hive当中并创建 ODS层

20.DWD数据采集模块

21.数仓搭建-DWS层

22.指标选取

23.创建ADS层并创建临时表,方便后续导入到mysql当中

24.mysql建表并导入数据

26.离线可视化

相关推荐
GIS数据转换器12 小时前
基于GIS的智慧旅游调度指挥平台
运维·人工智能·物联网·无人机·旅游·1024程序员节
一路随云0000013 小时前
基于Unity YooAsset自动化资源管理框架,附源代码
运维·自动化
数数科技的数据干货14 小时前
从爆款到厂牌:解读游戏工业化的业务持续增长道路
运维·数据库·人工智能
大聪明-PLUS17 小时前
如何使用 Docker 打包一个简单的应用程序:简易指南
linux·嵌入式·arm·smarc
深耕AI18 小时前
【完整教程】宝塔面板FTP配置与FileZilla连接服务器
运维·服务器
serve the people18 小时前
Prompts for Chat Models in LangChain
java·linux·langchain
李昊哲小课19 小时前
Ubuntu 24.04 MariaDB 完整安装与配置文档
linux·ubuntu·mariadb
无聊的小坏坏19 小时前
从单 Reactor 线程池到 OneThreadOneLoop:高性能网络模型的演进
服务器·网络·一个线程一个事件循环
AI智域边界 - Alvin Cho20 小时前
Bloomberg、LSEG 与 MCP 缺口:为什么尚未发布完整的 MCP 服务器,以及多智能体系统如何解決这问题
运维·服务器
人间打气筒(Ada)20 小时前
zerotier内网穿透部署(rockylinux部署本地服务器)超详细~~~
linux·内网穿透·内网·公网·zerotier·穿透