什么是数据分析

数据分析是通过总结数据的规律来解决业务问题。数据分析包括如下几个主要内容:

现状分析:分析现在发生了什么

原因分析:分析为什么会发送这种情况

预测分析:预测未来会出现什么

数据分析的基本流程:获取数据,数据处理,数据分析,验证结果

数据处理是从大量的、杂乱的、缺失的数据中抽取出对解决问题有意义的数据。

数据处理包括数据规约、数据清洗、数据加工

数据规约:保证数据完整性的同时减小数据的规模,提高数据处理速度

数据清洗:

  • 数据探索分析:统计判断数据是否存在缺失异常的情况
  • 缺失数据处理:对于缺失数据,如果较多直接删除。如果不多,可以填充,用0或者均值填充
  • 异常数据处理:对于不符合常理的数据进行删除

数据加工:

  • 数据抽取:选取数据部分内容
  • 数据计算:通过各种算法,得到进一步信息
  • 数据分组:按照有关信息进行分组
  • 数据转换:数据标准化处理,比如z_score标准
相关推荐
计算机毕设-小月哥几秒前
完整源码+技术文档!基于Hadoop+Spark的鲍鱼生理特征大数据分析系统免费分享
大数据·hadoop·spark·numpy·pandas·计算机毕业设计
Jinkxs3 分钟前
AI重塑金融风控:从传统规则到智能模型的信贷审批转型案例
大数据·人工智能
cwn_30 分钟前
牛津大学xDeepMind 自然语言处理(1)
人工智能·深度学习·机器学习·自然语言处理
前端双越老师37 分钟前
【干货】使用 langChian.js 实现掘金“智能总结” 考虑大文档和 token 限制
人工智能·langchain·node.js
leiya_1631 小时前
私有化部署本地大模型+function Calling+本地数据库
人工智能·ai·大模型
Dajiaonew1 小时前
Spring AI RAG 检索增强 应用
java·人工智能·spring·ai·langchain
z千鑫1 小时前
【OpenAI】 GPT-4o-realtime-preview 多模态、实时交互模型介绍+API的使用教程!
人工智能·gpt·语言模型·aigc
之歆2 小时前
大模型微调分布式训练-大模型压缩训练(知识蒸馏)-大模型推理部署(分布式推理与量化部署)-大模型评估测试(OpenCompass)
人工智能·笔记·python
爆改模型3 小时前
【Trans2025】计算机视觉|UMFormer:即插即用!让遥感图像分割更精准!
人工智能·计算机视觉
小五1273 小时前
机器学习实例应用
人工智能·机器学习