基于Hadoop平台的电信客服数据的处理与分析

[++++一、项目概述++++](#一、项目概述)

[++++1.1++++ ++++项目概述++++](#1.1 项目概述)

[++++1.2 项目框架++++](#1.2 项目框架)

[++++1.3 项目环境++++](#1.3 项目环境)

[++++1.4 项目需求++++](#1.4 项目需求)

项目概述

1.1、项目内容

本项目为基于Hadoop平台的电信客服数据的处理与分析，通过做项目的途径，对本学期所学的知识点进行总结和应用，有利于更好地掌握和使用数据处理系统。本项目有利于对通话信息进行总结和评估，可以清晰地体现出某个时间段的电信记录，对通讯服务进行反馈，具有极高的参考价值。通过本次项目，可以直观反映不同用户的电话使用时长，反映用户的性格，刻画用户画像，体现电信产业的当下状态。利用Hadoop对大量数据进行分析和处理，得到精简出的有益消息，有助于发现问题，对电信推广方法进行优化，考察不同用户的数据，贴近用户本身。反馈出产品的受欢迎程度。通过项目实践的方式，复习并利用所学到的知识点，温故而知新。场景为电信客服数据分析，包含用户信息，接通时间和接入呼出信息。搭建Hadoop全分布式集群，安装Hbase和hive，kafka，搭建flume大数据开发环境，进行数据的采集和分析。通过数据分析的结果，可以更加合理地分配推广资源，解决日常通话方面出现的问题，极大推动了电信行业的进步，化繁琐冗余为简练，在课程评估方面发挥出重要作用。

1.2、项目框架

开发工具：VMware16、idea、Centos

技术架构：Hadoop、Hive、Hbase、Zookeeper、flume

1.3、项目需求

个人在实践周单独完成实现以下3个场景：

（1）统计用户每日主叫的通话数量和时间。

（2）统计用户每月的通话记录和时间。

（3）通过用户之间的通话次数和时间，分析亲密关系。

二、项目调试与运行

2.1需求分析

不同用户通话数据，是对于该用户生活状态一项重要反馈，可以反映出用户的社交属性有很好的借鉴作用，对改良电信服务和改善用户体验发挥极大作用。通过对电信数据分析，可以明确通讯效果、用户喜爱程度、通讯受欢迎程度等信息，直观的表现发展成果。体现近期结果好坏程度，对导用户形象刻画进行评估。从而对未来此行业的发展方向进行更好的规划，精良方法，合理分配利用资源，使得变得更加专业，用户体验也同时得到提升。通过分析结果提出合理建议，对于电信行业发展和更上一层楼发挥极大作用。