什么是数据分析

数据分析是通过总结数据的规律来解决业务问题。数据分析包括如下几个主要内容:

现状分析:分析现在发生了什么

原因分析:分析为什么会发送这种情况

预测分析:预测未来会出现什么

数据分析的基本流程:获取数据,数据处理,数据分析,验证结果

数据处理是从大量的、杂乱的、缺失的数据中抽取出对解决问题有意义的数据。

数据处理包括数据规约、数据清洗、数据加工

数据规约:保证数据完整性的同时减小数据的规模,提高数据处理速度

数据清洗:

  • 数据探索分析:统计判断数据是否存在缺失异常的情况
  • 缺失数据处理:对于缺失数据,如果较多直接删除。如果不多,可以填充,用0或者均值填充
  • 异常数据处理:对于不符合常理的数据进行删除

数据加工:

  • 数据抽取:选取数据部分内容
  • 数据计算:通过各种算法,得到进一步信息
  • 数据分组:按照有关信息进行分组
  • 数据转换:数据标准化处理,比如z_score标准
相关推荐
IT古董9 分钟前
【漫话机器学习系列】259.神经网络参数的初始化(Initialization Of Neural Network Parameters)
人工智能·神经网络·机器学习
tyatyatya16 分钟前
神经网络在MATLAB中是如何实现的?
人工智能·神经网络·matlab
医只鸡腿子28 分钟前
3.2/Q2,Charls最新文章解读
数据库·数据挖掘·数据分析·深度优先·数据库开发
Jackson@ML1 小时前
一分钟了解大语言模型(LLMs)
人工智能·语言模型·自然语言处理
让学习成为一种生活方式1 小时前
大麦(Hordeum vulgare)中 BAHD 超家族酰基转移酶-文献精读129
人工智能
思茂信息1 小时前
CST软件对OPERA&CST软件联合仿真汽车无线充电站对人体的影响
c语言·开发语言·人工智能·matlab·汽车·软件构建
墨绿色的摆渡人1 小时前
pytorch小记(二十):深入解析 PyTorch 的 `torch.randn_like`:原理、参数与实战示例
人工智能·pytorch·python
lqjun08271 小时前
Pytorch实现常用代码笔记
人工智能·pytorch·笔记
qyhua1 小时前
用 PyTorch 从零实现简易GPT(Transformer 模型)
人工智能·pytorch·transformer
markuszhang1 小时前
Elasticsearch 官网阅读之 Term-level Queries
大数据·elasticsearch·搜索引擎