数据分析002

一、互联网数据分析的基本思路

二、描述性分析

描述性分析:通过计算数据的集中性特征和波动性特征以了解数据的基本情况。

数值分析:数量、平均数、极差、标准差、方差、极值

分布规律---均匀分布

均匀分布也叫矩形分布,它在相同长度间隔的分布概率是等可能的。

分布规律---正态分布

正态分布是一个非常常见的连续概率分布,其在统计学上的十分重要,经常用在自然和社会科学来代表一个不明的随机变量。

分布规律---长尾分布

互联网上从歌曲和软件的下载、网页的点击到网上店铺的销售,都呈现长尾分布的特征。曲线头部位置较高,随着序号的增大,曲线陡然下降,但在尾部位置曲线并没有迅速坠落到零,二十及其缓慢地贴近于横轴。

三、诊断性分析(关联分析)

诊断分析:深入挖掘问题根源,识别依赖关系,找出影响因子。

相关性只能解释过去,不能预测未来的一个发展。

诊断性分析---相关系数

四、预测性分析

预测性分析:使用线性回归或者逻辑回归的方法找到自变量与因变量之间的关系,并使用该关系式预测因变量的变化。

线性回归(评估系数估计的准确性)

逻辑回归(极大似然估计)

相关推荐
yvestine9 小时前
数据挖掘——神经网络分类
人工智能·深度学习·神经网络·机器学习·分类·数据挖掘
爱python的王三金10 小时前
【数据分析实战】24年T4某二手车交易平台数据分析
数据挖掘·数据分析
广西千灵通网络科技有限公司10 小时前
基于Python的投资组合收益率与波动率的数据分析
开发语言·python·数据分析
ningaiiii15 小时前
NSGA-II(非支配排序遗传算法II)详解与实现
人工智能·深度学习·神经网络·数据挖掘
牛猫Data18 小时前
Power BI如何连接Azure Databricks数据源?
microsoft·数据分析·azure·数据可视化·powerbi
SelectDB技术团队19 小时前
计算效率提升 10 倍,存储成本降低 60%,灵犀科技基于 Apache Doris 建设统一数据服务平台
大数据·数据库·数据仓库·数据分析·doris
背太阳的牧羊人19 小时前
df.groupby()方法使用在查询中用到的筛选条件函数对 数据进行分组
人工智能·数据挖掘·pandas
人大博士的交易之路20 小时前
1.1 假设一:走势包含一切信息
程序人生·数学建模·分类·数据挖掘·程序员创富
single_ffish21 小时前
数据挖掘入门介绍及代码实战
人工智能·爬虫·python·数据挖掘
dundunmm1 天前
【论文阅读】SCGC : Self-supervised contrastive graph clustering
论文阅读·人工智能·算法·数据挖掘·聚类·深度聚类·图聚类