数据分析002

一、互联网数据分析的基本思路

二、描述性分析

描述性分析:通过计算数据的集中性特征和波动性特征以了解数据的基本情况。

数值分析:数量、平均数、极差、标准差、方差、极值

分布规律---均匀分布

均匀分布也叫矩形分布,它在相同长度间隔的分布概率是等可能的。

分布规律---正态分布

正态分布是一个非常常见的连续概率分布,其在统计学上的十分重要,经常用在自然和社会科学来代表一个不明的随机变量。

分布规律---长尾分布

互联网上从歌曲和软件的下载、网页的点击到网上店铺的销售,都呈现长尾分布的特征。曲线头部位置较高,随着序号的增大,曲线陡然下降,但在尾部位置曲线并没有迅速坠落到零,二十及其缓慢地贴近于横轴。

三、诊断性分析(关联分析)

诊断分析:深入挖掘问题根源,识别依赖关系,找出影响因子。

相关性只能解释过去,不能预测未来的一个发展。

诊断性分析---相关系数

四、预测性分析

预测性分析:使用线性回归或者逻辑回归的方法找到自变量与因变量之间的关系,并使用该关系式预测因变量的变化。

线性回归(评估系数估计的准确性)

逻辑回归(极大似然估计)

相关推荐
fresh hacker3 小时前
【Python数据分析】速通NumPy
开发语言·python·数据挖掘·数据分析·numpy
相思半3 小时前
机器学习模型实战全解析
大数据·人工智能·笔记·python·机器学习·数据挖掘·transformer
艾上编程4 小时前
《Python实战小课:数据分析场景——解锁数据洞察之力》导读
python·数据挖掘·数据分析
民乐团扒谱机5 小时前
【微实验】谱聚类之大规模数据应用——Nyström 方法
人工智能·算法·机器学习·matlab·数据挖掘·聚类·谱聚类
测试人社区-千羽6 小时前
AI测试中的伦理考虑因素
运维·人工智能·opencv·测试工具·数据挖掘·自动化·开源软件
kangk127 小时前
单细胞转录组分析流程十一(细胞通讯,cellchat,单样本)
数据挖掘·单细胞
Skrrapper7 小时前
【大模型开发之数据挖掘】2.数据挖掘的核心任务与常用方法
数据库·人工智能·数据挖掘
Ada大侦探1 天前
新手小白学习Power BI第五弹--------产品分析以及产品毛利率报表、条件式标红、饼图、散点图
学习·数据分析·powerbi
IT·小灰灰1 天前
AI学会理解物理法则:OpenAI Sora 2如何重塑视频生成新范式
人工智能·python·深度学习·机器学习·数据挖掘·音视频
LiYingL1 天前
PictSure:通过视觉嵌入功能挑战 _Few-Shot _分类的新方法
人工智能·分类·数据挖掘