数据分析
是利用数学、统计学理论相结合的科学统计分析方法、对 Excel数据、数据库中的数据、收集的大量数据、网页抓取的数据进行分析,从中提取有价值的信息并开成结论进行展示的过程
数据分析主要内容
- 现状分析:分析已经发生了什么
- 原因分析:分析为什么会出现这种现状
- 预测分析:预测未来可能发生什么
数据分析的基本流程
- 熟悉工具
- 明确目的
- 获取数据
- 数据处理
- 数据分析
- 验证结果
- 结果呈现
- 数据应用
行业覆盖
电商、在线教育、医疗、保险、金融、在线听书、物流、广告、新能源汽车、彩票
分析内容
电商:
日活、周活、"月活、新增、沉默、回流、流失、留存数、留存率、最近连续三周活跃、最近七天连续三天活跃漏斗分析、spu个数、sku个数、商品销量排名、商品收藏排名、商品加入购物车排名、商品退款率排名、商品差评率、单日下单笔数、单日下单金额、单日下单用户数、单日支付笔数单日支付金额、单日支付人数、单日支付商品数、下单到支付的平均时长单次复购率、多次复购率、购买人数累积登录天数、最近多次购买人数30日登录天数累积下单次数、累积下单金额、最近30日下单次数、最近30日下单金额、累积支付次数累积支付金额、最近30日支付次数、最近30日支付金额、累积退款次数、累积退款件数、累税退款金额、最近30日被加入购物车次数、最近30日被加入购物车件数、累积被加入购物车次数
离线分析
在线分析
在线教育
当日各来源访客数、会话平均停留时长、会话平均浏览页面数、总会话数、跳出率、下单统计、页面浏览路径分析流失用户数、回流用户数、用户留存率、新增用户数、活跃用户数、用户行为漏斗分析、新增交易人数、各年龄段下单用户数;当日各分类下单数、下单人数、下单金额、下单数、各学科下单数、各学科下单人数、各学科下单金额各课程下单数、各课程下单人数、各课程下单金额、各课程用户平均评分、各课程评价用户数、各课程用户好评率各分类试听人数、各分类试听留存率、各学科试听人数各学科试听留存率、各课程试听人数、各课程试听留存率当日下单总额、下单数、下单人数、各省份下单数、各省份下单人数、各省份下单金额:当日各试卷平均分、各试卷平均答题时长、各试卷答题用户数、各课程平均分、各课程平均答题时长、各课程答题用户数、各试卷在各个分数区间的用户数、各题目正确率当日各章节视频播放次数、各章节视频人均观看时长、各章节视频观看人数、各课程视频播放次数、各课程人均观看时长、各课程视频观看人数;当日各课程完课人数统计总完课人数统计、总完课人次统计..
保险
金融
在线听书
大数据生态体系
学习路线图
graph LR A[数据处理] --> 数据规约-->减少数据规模 A[数据处理] --> 数据清洗-->数据探索分析 数据清洗-->重复数据处理 数据清洗-->缺失数据处理 数据清洗-->异常数据处理 数据清洗-->异常数据处理 A[数据处理] --> 数据加工-->数据抽取 数据加工-->数据计算 数据加工-->数据分组 数据加工-->数据转换