数据分析002

一、互联网数据分析的基本思路

二、描述性分析

描述性分析:通过计算数据的集中性特征和波动性特征以了解数据的基本情况。

数值分析:数量、平均数、极差、标准差、方差、极值

分布规律---均匀分布

均匀分布也叫矩形分布,它在相同长度间隔的分布概率是等可能的。

分布规律---正态分布

正态分布是一个非常常见的连续概率分布,其在统计学上的十分重要,经常用在自然和社会科学来代表一个不明的随机变量。

分布规律---长尾分布

互联网上从歌曲和软件的下载、网页的点击到网上店铺的销售,都呈现长尾分布的特征。曲线头部位置较高,随着序号的增大,曲线陡然下降,但在尾部位置曲线并没有迅速坠落到零,二十及其缓慢地贴近于横轴。

三、诊断性分析(关联分析)

诊断分析:深入挖掘问题根源,识别依赖关系,找出影响因子。

相关性只能解释过去,不能预测未来的一个发展。

诊断性分析---相关系数

四、预测性分析

预测性分析:使用线性回归或者逻辑回归的方法找到自变量与因变量之间的关系,并使用该关系式预测因变量的变化。

线性回归(评估系数估计的准确性)

逻辑回归(极大似然估计)

相关推荐
~~李木子~~4 小时前
中文垃圾短信分类实验报告
人工智能·分类·数据挖掘
源码之家9 小时前
基于Python房价预测系统 数据分析 Flask框架 爬虫 随机森林回归预测模型、链家二手房 可视化大屏 大数据毕业设计(附源码)✅
大数据·爬虫·python·随机森林·数据分析·spark·flask
谅望者10 小时前
数据分析笔记08:Python编程基础-数据类型与变量
数据库·笔记·python·数据分析·概率论
xuehaikj12 小时前
香烟品牌识别与分类:yolov5-LSKNet模型应用
yolo·数据挖掘
咚咚王者12 小时前
人工智能之数据分析 numpy:第七章 数组迭代排序筛选
人工智能·数据分析·numpy
翼龙云_cloud17 小时前
阿里云渠道商:如何将极速型 NAS 实例迁移至新实例?
运维·服务器·阿里云·数据分析·云计算
计算机软件程序设计18 小时前
基于Python的新能源汽车销量数据分析与预测系统设计与实现
python·机器学习·数据分析·销量预测
databook20 小时前
深入浅出理解你的“数据”
python·数据分析
马拉萨的春天21 小时前
iOS的分类中为什么不能添加变量以及如何设置关联对象的弱引用效果
ios·分类·数据挖掘
q***318921 小时前
爬虫基础之爬取某基金网站+数据分析
爬虫·数据挖掘·数据分析