数据分析的基本步骤

了解过数据分析的概念之后,我们再来说下数据分析的常规步骤。

明确目标

首先我们要确定一个目标,即我们要从数据中得到什么。比如我们要看某个指标A随时间的变化趋势,以期进行简单的预测。

数据收集

当确定了目标之后,就有了取数的方向。比如我们要观察A随时间的变化,就要记录A的值。或者从已经记录了A的值的数据库、文件、日志等取数。

数据清洗和预处理

有时候我们收集的数据并不是完全有效的,或者并不能为我们的服务。这个时候就需要把这部分数据剔除。或者有时候我们收集到的是文本数据,需要做一下归类,使用数字等符号来做替代,方便做数据的相关性分析,这个时候就需要对数据左小处理。

探索性数据分析(EDA)

使用统计图表来多维度展示数据,更直观地去查看数据地特征。

数据分析和建模

选择适当的数据分析方法和建模技术,来将得到地结论模型化。比如把折线图拟合成曲线。

评估模型

使用测试数据测试模型,评估模型准确性。

利用模型

利用模型做一些数据预测,支撑我们目标之上地目标。

相关推荐
Oculus Reparo!1 小时前
InternLM 论文分类微调实践(XTuner 版)
人工智能·分类·数据挖掘
从零开始学习人工智能18 小时前
Doris 与 Elasticsearch:谁更适合你的数据分析需求?
大数据·elasticsearch·数据分析
武汉格发Gofartlic18 小时前
FEMFAT许可使用数据分析工具介绍
python·信息可视化·数据分析
数模竞赛Paid answer20 小时前
2023年全国研究生数学建模竞赛华为杯D题区域双碳目标与路径规划研究求解全过程文档及程序
数学建模·数据分析·华为杯
Dfreedom.21 小时前
Excel文件数据的读取和处理方法——C++
c++·数据分析·excel·数据预处理
hkfkn1 天前
数据分析实战2(Tableau)
信息可视化·数据挖掘·数据分析
atbigapp.com1 天前
告别excel:AI 驱动的数据分析指南
人工智能·数据分析·aigc
pythonqiang91 天前
Pandas:你的数据分析瑞士军刀![特殊字符]✨
其他·数据挖掘·数据分析·pandas
wzy06231 天前
MADlib —— 基于 SQL 的数据挖掘解决方案(9)—— 数据探索之概率统计
数据挖掘·madlib
亚马逊云开发者1 天前
基于 Agentic AI + Amazon Redshift MCP Server 实现 Agentic Data Analysis
人工智能·数据分析