基于Hadoop平台的电信客服数据的处理与分析①项目准备阶段---项目技术预研（技术架构）

我非夏日2024-07-03 9:00

任务描述

掌握项目的总体功能，及实现流程。预习项目中所使用到的技术和知识点。

任务指导

一、项目效果展示

二、项目架构

1、总体架构：

2、技术架构

技术清单：

功能	组件	说明
消息中间件	Kafka	消息队列
数据采集	Flume	日志采集工具
存储	HDFS	分布式文件系统
存储	MySQL	关系数据库
监控管理调度运维	YARN	分布式资源调度分配
监控管理调度运维	Zookeeper	集群节点协调
项目开发框架	Maven	项目管理工具
项目开发框架	IntelliJ IDEA	项目集成开发环境

三、项目主要涉及的技术

1、技术选型：项目的解决方案

以Maven+IntelliJ IDEA作为开发环境，以Hadoop HDFS、HBase为底层存储，通过分析HBase数据将结果存储在MySQL供前端框架展示。

中间件：Kafka
平台调度：YARN
数据存储，持久化：HDFS、HBase，MySQL
数据可视化：Spring Framework

2、平台总体分为4个层级，按数据流入及数据处理顺序，依次分为

1）数据导入层

数据导入需满足以下要求：

已开启Hadoop HDFS框架环境，已开启Highly Available（HA）高可用。

2）数据存储层

导入的数据统一经过Kafka缓存，以避免数据堵塞保证系统的稳定性。

3）数据分析层

已开启Hadoop YARN框架环境，已开启Highly Available（HA）高可用。

4）应用层

模拟电信呼叫数据保存至本地CallLog.txt文件；
Flume推送CallLog.txt文件到Kafka进行缓存；
读取Kafka数据进行预处理并持久化道HBase；
对HBase数据进行分析统计，将结果保存至MySQL供前端Spring Framework查询展示。

四、参考资料

《Linux操作系统》
《Hadoop权威指南：大数据的存储与分析(第4版)》
《Kafka权威指南》
《Redis设计与实现》
《数据可视化技术》

上一篇：计算机网络网络层复习题2

下一篇：OpenCV 用mediapipe做一个虚拟鼠标

热门推荐

012026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 02GitHub 镜像站点 03如何新建文件夹？电脑新建文件夹的4种方法 04AI科技热点日报 | 2026年07月01日 05幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 06国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 082026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？092026 年 AI 大模型 & AI 编程工具实战全总结 10【解构】DeepSeek V4 发布：技术报告深度解读 + 横向对比六大开源模型，我们的判断是……