数据分析002

一、互联网数据分析的基本思路

二、描述性分析

描述性分析:通过计算数据的集中性特征和波动性特征以了解数据的基本情况。

数值分析:数量、平均数、极差、标准差、方差、极值

分布规律---均匀分布

均匀分布也叫矩形分布,它在相同长度间隔的分布概率是等可能的。

分布规律---正态分布

正态分布是一个非常常见的连续概率分布,其在统计学上的十分重要,经常用在自然和社会科学来代表一个不明的随机变量。

分布规律---长尾分布

互联网上从歌曲和软件的下载、网页的点击到网上店铺的销售,都呈现长尾分布的特征。曲线头部位置较高,随着序号的增大,曲线陡然下降,但在尾部位置曲线并没有迅速坠落到零,二十及其缓慢地贴近于横轴。

三、诊断性分析(关联分析)

诊断分析:深入挖掘问题根源,识别依赖关系,找出影响因子。

相关性只能解释过去,不能预测未来的一个发展。

诊断性分析---相关系数

四、预测性分析

预测性分析:使用线性回归或者逻辑回归的方法找到自变量与因变量之间的关系,并使用该关系式预测因变量的变化。

线性回归(评估系数估计的准确性)

逻辑回归(极大似然估计)

相关推荐
2zcode7 小时前
基于YOLO11的轨道交通车站客流密度实时监测与拥挤预警系统(数据集+UI界面+训练代码+数据分析)
目标跟踪·数据挖掘·数据分析·客流量
Captain_Data8 小时前
Python机器学习实战:用Scikit-learn从0构建信用风险评分模型(含WOE编码+AUC/KS/PSI评估+评分卡转换)
python·机器学习·数据分析·scikit-learn·风控建模
jerryinwuhan8 小时前
面向校园场景的网络舆情文本分类、情感分析与聚类预警系统
分类·数据挖掘·聚类
极光代码工作室9 小时前
基于大数据的交通流量分析系统
大数据·hadoop·python·数据分析·数据可视化
码界筑梦坊9 小时前
361-基于Python的空气质量气候数据分析预测系统
python·信息可视化·数据分析·flask·vue·毕业设计
YangYang9YangYan9 小时前
产品经理学习数据分析的价值与路径
学习·数据分析·产品经理
哩哩橙9 小时前
分支电路对限时电流速断保护的影响
人工智能·笔记·数据挖掘
babe小鑫10 小时前
2026数学专业人才发展学数据分析的价值
数据挖掘·数据分析
2zcode11 小时前
基于YOLO11的人员异常行为检测与识别智能安防监控系统(数据集+UI界面+训练代码+数据分析)
数据挖掘·数据分析
SimpleLearingAI20 小时前
聚类算法详解
算法·数据挖掘·聚类