大数据-数据分析初步学习,待补充

参考视频:数据分析只需3小时从入门到进阶(up亲身实践)_哔哩哔哩_bilibili

数据指标:

当前业务 有参考价值的统计数据

分类:用户数据,业务数据,行为数据

用户数据

存量:
DAU(daily active user):

日活跃用户,定义一个自然日不重复(去重)的用户,跨时区(如全球服务),则关心最近24小时

MAU(monthly active user):

月活跃用户,MAU <= 总用户数,一个月里不重复(去重)的用户总量

活跃:事件上报 -》定义为活跃用户

1 用户的主动动作定义为活跃用户, 谨防:活跃数据爆增,但其他数据没有明显变化

2 操作事件定义为活跃用户,列出 日活事件列表(存在维护和沟通成本)

增量:
新增用户
健康程度:
存留率

从哪儿来:

渠道来源

业务数据

总量:
GMV(Gross Merchandise Volume) :商品交易总额
访问时长
人均:
ARPU:

每用户平均收入,计算某段时间内平均每个活跃用户为应用创造的收入

ARPPU:

每付费用户平均收益,计算某短时间内平均每个付费用户为应用创造的收入

人均访问时长
人数:

付费人数

访问人数

健康程度:

付费率,付费频次

留存率

被消费对象

SKU视角

被消费内容视角

行为数据

次数、频率
PV(Page Views):页面浏览量

不去重

UV(Unique Visitors):独立访问数

去重

一般PV/PV,UV/UV,也有PV/UV,eg:详情页PV/详情页UV=人均页面查看数

深度访问
路径走通程度:
转化率
做了多久
时长
质量
弹出率(Bounce Rate)

用户来了,啥都没干,立马走了

弹出率:3(用户1,4,6)/6,如果用户1多次来了,按不去重统计

数据分析

01 对比分析

环比:日环比(今天和昨天),周环比(本周和上一周),月环比..

同比:周同比(本周的第几天和上周的第几天对比),月同比...

02 多维度拆分

单纯看人数,无从下手如何提高,可以从渠道、城市等维度查看

03 漏斗观察分析

04 分布分析

05 用户留存分析

06 用户画像分析

07 归因查找分析

​​​​​​​

08 路径挖掘分析

09 行为序列分析

相关推荐
武子康32 分钟前
大数据-244 离线数仓 - Hive ODS 层建表与分区加载实战(DataX→HDFS→Hive)
大数据·后端·apache hive
武子康1 天前
大数据-243 离线数仓 - 实战电商核心交易增量导入(DataX - HDFS - Hive 分区
大数据·后端·apache hive
代码匠心3 天前
从零开始学Flink:Flink SQL四大Join解析
大数据·flink·flink sql·大数据处理
武子康4 天前
大数据-242 离线数仓 - DataX 实战:MySQL 全量/增量导入 HDFS + Hive 分区(离线数仓 ODS
大数据·后端·apache hive
SelectDB5 天前
易车 × Apache Doris:构建湖仓一体新架构,加速 AI 业务融合实践
大数据·agent·mcp
武子康5 天前
大数据-241 离线数仓 - 实战:电商核心交易数据模型与 MySQL 源表设计(订单/商品/品类/店铺/支付)
大数据·后端·mysql
IvanCodes5 天前
一、消息队列理论基础与Kafka架构价值解析
大数据·后端·kafka
武子康6 天前
大数据-240 离线数仓 - 广告业务 Hive ADS 实战:DataX 将 HDFS 分区表导出到 MySQL
大数据·后端·apache hive
字节跳动数据平台7 天前
5000 字技术向拆解 | 火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
武子康7 天前
大数据-239 离线数仓 - 广告业务实战:Flume 导入日志到 HDFS,并完成 Hive ODS/DWD 分层加载
大数据·后端·apache hive