什么是数据分析

数据分析是通过总结数据的规律来解决业务问题。数据分析包括如下几个主要内容:

现状分析:分析现在发生了什么

原因分析:分析为什么会发送这种情况

预测分析:预测未来会出现什么

数据分析的基本流程:获取数据,数据处理,数据分析,验证结果

数据处理是从大量的、杂乱的、缺失的数据中抽取出对解决问题有意义的数据。

数据处理包括数据规约、数据清洗、数据加工

数据规约:保证数据完整性的同时减小数据的规模,提高数据处理速度

数据清洗:

  • 数据探索分析:统计判断数据是否存在缺失异常的情况
  • 缺失数据处理:对于缺失数据,如果较多直接删除。如果不多,可以填充,用0或者均值填充
  • 异常数据处理:对于不符合常理的数据进行删除

数据加工:

  • 数据抽取:选取数据部分内容
  • 数据计算:通过各种算法,得到进一步信息
  • 数据分组:按照有关信息进行分组
  • 数据转换:数据标准化处理,比如z_score标准
相关推荐
wx740851326几秒前
小琳AI课堂:机器学习
人工智能·机器学习
FL16238631298 分钟前
[数据集][目标检测]车油口挡板开关闭合检测数据集VOC+YOLO格式138张2类别
人工智能·yolo·目标检测
YesPMP平台官方10 分钟前
AI+教育|拥抱AI智能科技,让课堂更生动高效
人工智能·科技·ai·数据分析·软件开发·教育
Data-Miner11 分钟前
196页满分PPT | 集团流程优化及IT规划项目案例
大数据·数据分析
徐*红14 分钟前
Elasticsearch 8.+ 版本查询方式
大数据·elasticsearch
DolphinScheduler社区27 分钟前
怎么办?用DolphinScheduler调度执行复杂的HiveSQL时无法正确识别符号
大数据
goTsHgo29 分钟前
Hive自定义函数——简单使用
大数据·hive·hadoop
码爸31 分钟前
flink 例子(scala)
大数据·elasticsearch·flink·scala
FLGB31 分钟前
Flink 与 Kubernetes (K8s)、YARN 和 Mesos集成对比
大数据·flink·kubernetes
码爸33 分钟前
flink 批量压缩redis集群 sink
大数据·redis·flink