数据分析002

一、互联网数据分析的基本思路

二、描述性分析

描述性分析:通过计算数据的集中性特征和波动性特征以了解数据的基本情况。

数值分析:数量、平均数、极差、标准差、方差、极值

分布规律---均匀分布

均匀分布也叫矩形分布,它在相同长度间隔的分布概率是等可能的。

分布规律---正态分布

正态分布是一个非常常见的连续概率分布,其在统计学上的十分重要,经常用在自然和社会科学来代表一个不明的随机变量。

分布规律---长尾分布

互联网上从歌曲和软件的下载、网页的点击到网上店铺的销售,都呈现长尾分布的特征。曲线头部位置较高,随着序号的增大,曲线陡然下降,但在尾部位置曲线并没有迅速坠落到零,二十及其缓慢地贴近于横轴。

三、诊断性分析(关联分析)

诊断分析:深入挖掘问题根源,识别依赖关系,找出影响因子。

相关性只能解释过去,不能预测未来的一个发展。

诊断性分析---相关系数

四、预测性分析

预测性分析:使用线性回归或者逻辑回归的方法找到自变量与因变量之间的关系,并使用该关系式预测因变量的变化。

线性回归(评估系数估计的准确性)

逻辑回归(极大似然估计)

相关推荐
IT毕设梦工厂2 小时前
大数据毕业设计选题推荐-基于大数据的客户购物订单数据分析与可视化系统-Hadoop-Spark-数据可视化-BigData
大数据·hadoop·数据分析·spark·毕业设计·源码·bigdata
大数据CLUB9 小时前
基于spark的澳洲光伏发电站选址预测
大数据·hadoop·分布式·数据分析·spark·数据开发
智数研析社12 小时前
9120 部 TMDb 高分电影数据集 | 7 列全维度指标 (评分 / 热度 / 剧情)+API 权威源 | 电影趋势分析 / 推荐系统 / NLP 建模用
大数据·人工智能·python·深度学习·数据分析·数据集·数据清洗
qingyunliushuiyu13 小时前
BI数据可视化:驱动数据价值释放的关键引擎
数据挖掘·数据分析·数据分析系统·数据分析平台·bi数据可视化
折翼的恶魔15 小时前
数据分析:排序
python·数据分析·pandas
HenrySmale17 小时前
05 回归问题和分类问题
分类·数据挖掘·回归
数据牧羊人的成长笔记20 小时前
数据分析需要掌握的数学知识(易理解)
数学建模·数据分析
victory043120 小时前
wav2vec微调进行疾病语音分类任务
人工智能·分类·数据挖掘
折翼的恶魔21 小时前
数据分析:合并二
python·数据分析·pandas