数据分析01——系统认识数据分析

1.数据分析的全貌

1.1观测

1.1.1 观察

(1)采集数据

a.采集数据:解析系统日志

当你在看视频的时候---------就会产生日志---------解析日志---------得到数据

b.采集数据:埋点获取新数据(自定义记录新的信息)

日志记录你观看视频的IP,通过IP的解析,就可以知道你的观看地址。而这整个基于系统日志新增的数据过程,就称为埋点。

埋点是分析师获取新数据的主要方式,也是最可控、最可靠的方式。

c.采集数据:通过传感器采集

d.采集数据:爬虫

e.采集数据:API(Application Programing Interface)

(2)储存数据

a.储存数据:各种类型的数据库

数据采集得到的数据都放在数据库,由专门另外的程序员去维护开发,而不是放在本地磁盘里。

b.储存数据:连接数据库取数

(3)展示数据

a.展示数据:可视化高效传达信息

1.1.2 测量

设定标准、发现异常、研究关系

分析数据的目的是什么?

一、及时发现异常

二、找到数据之间的因果关系
数据是客观统一的

在任何人眼里:1+1=2

有统一的认知才能有共同的目标

(1)设定标准+发现异常

例如:今年的销售额是一千两百万,平均到每个月就一百万,如果每个月都完成到一百万以上的目标,一定能够完成。此时,每个月一百万就是一个正常的数据。我们只需要拿这个数据作为判断标准,就能够客观衡量当前业务的情况。
在经典的咨询的场景里面,数据标准称为Benchmark,也是进行分析判断的重要依据。如果当月的销售额低于了一百万,就称为出现了异常,对异常值的发现,可以让企业避免不必要的损失。

(2)研究关系

1.2实验

1.2.1 拆解问题、提出假设、设计实验

(a)提出假设,然后验证假设

例如外卖收到差评率变多了--->假设是因为恶劣天气引起的--->通过一次次的验证,就可以得到一个规律,确实是因为恶劣的天气造成的

提示:所有未经事实数据验证的想法都是假设

设计A/B测试获取数据

1.2.2 收集数据、分析数据、验证假设

1.3 应用

  • 制定策略、实施策略、反馈迭代
  • 训练算法、优化算法、使用算法

如何应用数据创造价值?

(1)基于数据反馈不断迭代产品和业务策略

(2)基于数据训练算法,让机器自动化地完成工作

1.3.1 拆解方法(自己整理)

拆解只要符合MECE法则即可

(1)流程拆解法

流程拆解法就是按照事情发展的时间、流程、程序,对过程进行逐一的拆解。

例如:分解消费者的购物过程:看见广告->点进-点击购买->付款->下单->支付。类似于漏斗分析法,是一种流程分析,适用于流程长,环节较多,并且随着环节的进行,留存率越来越少的场景。

(2)二分法

二分法在日常生活中比较常见,就是把事物分成A和非A两个部分,如"白天、黑夜"、"男人、女人"、"国内、国外"、"内部、外部"等。

二分法用于简化思维,当一件事情很复杂,超出理解范围,又需要快速做出决策,那么就可以用二分法来简化事物,快速完成决策。

(3)象限拆解法

象限拆解法是数据分析中常用的一种方法,主要用于分析数据集中的趋势、关联或者特征。它通常应用于二维数据,将数据分布根据两个维度进行分类,形成四个象限。

采用横向坐标法,将所要分析的信息分为四个象限,从高到低分别进行分析。

  1. 有助于发现问题的共同成因:采用象限分析方法,对具有相似特点的事件进行归因分析,归纳出共同的成因。
  2. 建立分类最优策略:根据输入的象限分析方法,可以根据不同的象限来确定最优策略。

例如:X轴从左到右的点击率的高低,Y轴从下到上是转化率的高低,形成了4个象限,这就是我们要说的象限分析法。针对每次营销活动的点击率和转化率找到相应的数据标点,然后将这次营销活动的效果归到每个象限,4个象限分别代表了不同的效果评估。

象限一:高点击转化,点击高代表营销创意打动了受众,转化高代表被打动的首众是产品的目标用户。

象限二:高转化低点击,同样的,高点击代表被打动的受众是产品的目标用户,但低点击代表的是营销创意没有打动用户;

象限三:低点击低转化,这个象限是最糟糕的营销活动了,投放广告点击少,点击用户转化低,创意无效,用户不精准;

象限四:高点击低转化,这个象限的营销活动要给策划和文案加鸡腿,但就要给渠道扣绩效了。这种象限的营销活动一定程度上有标题党的嫌疑。

(4)杜邦分析法

杜邦分析法是利用几种主要的财务比率之间的关系来综合地分析企业的财务状况,具体来说,是一种用来评价公司盈利能力和股东权益回报水平,从财务角度评价企业绩效的一种经典方法。

其基本思想是将企业净资产收益率逐级分解为多项财务比率乘积,这样有助于深入分析比较企业经营业绩。

(5)AARRR模型

AARRR是一个用于研究用户增长的数据分析模型,是Acquisition、Activation、Retention、Revenue、Refer这五个单词的缩写,分别对应用户生命周期的用户获取、用户激活、用户存留、获得收益、推荐传播这五个环节。

(6)PEST模型

PEST分析法就是从政治(Political)、经济(Economic)、社会(Society)、技术(Technology)四个方面,基于公司战略的眼光来分析企业外部宏观环境的一种方法。

公司的发展战略与宏观环境息息相关,PEST分析可以更好地把握宏观经济形势和发展趋势,从而更好地把握公司的生存发展机遇,及时发现和规避环境的潜在风险。

(7)RFM模型

RFM模型是指根据客户活跃度和交易金额贡献,进行客户价值细分的一种方法。主要应用于精细化运营、用户分层分析、用户会员体系建立。

根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有三个神奇的要素,这三个要素构成了数据分析最好的指标:

  • 最近一次消费(Recency)
  • 消费频率(Frequency)
  • 消费金额(Monetary)

(8)SWOT模型

SWOT模型分析法代表企业优势(Strength)、劣势(weakness)、机会(opportunity)和威胁(threats)。

SWOT分析实质上是一种综合和总结企业外部环境的各种因素,从而分析企业的优势、劣势、机遇和威胁的一种方法,可以通过分析帮助企业把资源和行动集中在自己的强项和有最多机会的地方。

(9)5W1H模型

Who(分析对象) 确定主题对象

Where(从哪里获取数据)进行数据集成

When(获取哪些时间段的数据)确定时间间隔

What(用什么分析方法)具体的手段方法

Why (什么原因导致的)背景和根本原因

How (如何呈现最终结果)分析报告

1.3.2 将数据应用于业务

1.3.3 将数据应用于算法

相关推荐
张人玉7 小时前
数据可视化pyecharts——数据分析(柱状图、折线图、饼图)
信息可视化·数据挖掘·数据分析
环能jvav大师20 小时前
基于R语言的统计分析基础:使用键盘输入数据
开发语言·学习·数据分析·r语言·人机交互
进击的C语言20 小时前
【PyCharm】和git安装教程
python·搜索引擎·pycharm·数据分析
学长小陈来帮你20 小时前
机械学习—零基础学习日志(Python做数据分析04)
开发语言·python·学习·线性代数·数据分析
B站计算机毕业设计超人1 天前
计算机毕业设计Python知识图谱美团美食推荐系统 美团餐厅推荐系统 美团推荐系统 美食价格预测 美团爬虫 美食数据分析 美食可视化大屏
爬虫·python·深度学习·机器学习·数据分析·数据可视化·推荐算法
图数据库NebulaGraph1 天前
波克城市 x NebulaGraph|高效数据血缘系统在游戏领域的构建实战
数据库·游戏·数据分析·图数据库
Dreams°1231 天前
pyecharts可视化数据大屏【详细教程】
大数据·python·测试工具·信息可视化·数据分析·html·数据可视化
chnyi6_ya1 天前
前端设计之 主页面、书架页面、数据分析页面
前端·python·数据分析
Code哈哈笑1 天前
【Python 数据分析学习】Pandas的基础和应用(2)
python·学习·数据分析
惟长堤一痕1 天前
医学数据分析实训 项目二 数据预处理作业
数据挖掘·数据分析