什么是数据分析

数据分析是通过总结数据的规律来解决业务问题。数据分析包括如下几个主要内容:

现状分析:分析现在发生了什么

原因分析:分析为什么会发送这种情况

预测分析:预测未来会出现什么

数据分析的基本流程:获取数据,数据处理,数据分析,验证结果

数据处理是从大量的、杂乱的、缺失的数据中抽取出对解决问题有意义的数据。

数据处理包括数据规约、数据清洗、数据加工

数据规约:保证数据完整性的同时减小数据的规模,提高数据处理速度

数据清洗:

  • 数据探索分析:统计判断数据是否存在缺失异常的情况
  • 缺失数据处理:对于缺失数据,如果较多直接删除。如果不多,可以填充,用0或者均值填充
  • 异常数据处理:对于不符合常理的数据进行删除

数据加工:

  • 数据抽取:选取数据部分内容
  • 数据计算:通过各种算法,得到进一步信息
  • 数据分组:按照有关信息进行分组
  • 数据转换:数据标准化处理,比如z_score标准
相关推荐
起名字什么的好难16 分钟前
conda虚拟环境安装pytorch gpu版
人工智能·pytorch·conda
18号房客23 分钟前
计算机视觉-人工智能(AI)入门教程一
人工智能·深度学习·opencv·机器学习·计算机视觉·数据挖掘·语音识别
百家方案25 分钟前
「下载」智慧产业园区-数字孪生建设解决方案:重构产业全景图,打造虚实结合的园区数字化底座
大数据·人工智能·智慧园区·数智化园区
statistican_ABin26 分钟前
R语言数据分析案例46-不同区域教育情况回归分析和探索
数据挖掘·数据分析
云起无垠31 分钟前
“AI+Security”系列第4期(一)之“洞” 见未来:AI 驱动的漏洞挖掘新范式
人工智能
forestsea32 分钟前
【Elasticsearch】分片与副本机制:优化数据存储与查询性能
大数据·elasticsearch·搜索引擎
开着拖拉机回家39 分钟前
【Ambari】使用 Knox 进行 LDAP 身份认证
大数据·hadoop·gateway·ambari·ldap·knox
地球资源数据云1 小时前
全国30米分辨率逐年植被覆盖度(FVC)数据集
大数据·运维·服务器·数据库·均值算法
QQ_7781329741 小时前
基于深度学习的图像超分辨率重建
人工智能·机器学习·超分辨率重建
梦想画家1 小时前
Python Polars快速入门指南:LazyFrames
python·数据分析·polars