数据分析01——系统认识数据分析

1.数据分析的全貌

1.1观测

1.1.1 观察

(1)采集数据

a.采集数据:解析系统日志

当你在看视频的时候---------就会产生日志---------解析日志---------得到数据

b.采集数据:埋点获取新数据(自定义记录新的信息)

日志记录你观看视频的IP,通过IP的解析,就可以知道你的观看地址。而这整个基于系统日志新增的数据过程,就称为埋点。

埋点是分析师获取新数据的主要方式,也是最可控、最可靠的方式。

c.采集数据:通过传感器采集

d.采集数据:爬虫

e.采集数据:API(Application Programing Interface)

(2)储存数据

a.储存数据:各种类型的数据库

数据采集得到的数据都放在数据库,由专门另外的程序员去维护开发,而不是放在本地磁盘里。

b.储存数据:连接数据库取数

(3)展示数据

a.展示数据:可视化高效传达信息

1.1.2 测量

设定标准、发现异常、研究关系

分析数据的目的是什么?

一、及时发现异常

二、找到数据之间的因果关系
数据是客观统一的

在任何人眼里:1+1=2

有统一的认知才能有共同的目标

(1)设定标准+发现异常

例如:今年的销售额是一千两百万,平均到每个月就一百万,如果每个月都完成到一百万以上的目标,一定能够完成。此时,每个月一百万就是一个正常的数据。我们只需要拿这个数据作为判断标准,就能够客观衡量当前业务的情况。
在经典的咨询的场景里面,数据标准称为Benchmark,也是进行分析判断的重要依据。如果当月的销售额低于了一百万,就称为出现了异常,对异常值的发现,可以让企业避免不必要的损失。

(2)研究关系

1.2实验

1.2.1 拆解问题、提出假设、设计实验

(a)提出假设,然后验证假设

例如外卖收到差评率变多了--->假设是因为恶劣天气引起的--->通过一次次的验证,就可以得到一个规律,确实是因为恶劣的天气造成的

提示:所有未经事实数据验证的想法都是假设

设计A/B测试获取数据

1.2.2 收集数据、分析数据、验证假设

1.3 应用

  • 制定策略、实施策略、反馈迭代
  • 训练算法、优化算法、使用算法

如何应用数据创造价值?

(1)基于数据反馈不断迭代产品和业务策略

(2)基于数据训练算法,让机器自动化地完成工作

1.3.1 拆解方法(自己整理)

拆解只要符合MECE法则即可

(1)流程拆解法

流程拆解法就是按照事情发展的时间、流程、程序,对过程进行逐一的拆解。

例如:分解消费者的购物过程:看见广告->点进-点击购买->付款->下单->支付。类似于漏斗分析法,是一种流程分析,适用于流程长,环节较多,并且随着环节的进行,留存率越来越少的场景。

(2)二分法

二分法在日常生活中比较常见,就是把事物分成A和非A两个部分,如"白天、黑夜"、"男人、女人"、"国内、国外"、"内部、外部"等。

二分法用于简化思维,当一件事情很复杂,超出理解范围,又需要快速做出决策,那么就可以用二分法来简化事物,快速完成决策。

(3)象限拆解法

象限拆解法是数据分析中常用的一种方法,主要用于分析数据集中的趋势、关联或者特征。它通常应用于二维数据,将数据分布根据两个维度进行分类,形成四个象限。

采用横向坐标法,将所要分析的信息分为四个象限,从高到低分别进行分析。

  1. 有助于发现问题的共同成因:采用象限分析方法,对具有相似特点的事件进行归因分析,归纳出共同的成因。
  2. 建立分类最优策略:根据输入的象限分析方法,可以根据不同的象限来确定最优策略。

例如:X轴从左到右的点击率的高低,Y轴从下到上是转化率的高低,形成了4个象限,这就是我们要说的象限分析法。针对每次营销活动的点击率和转化率找到相应的数据标点,然后将这次营销活动的效果归到每个象限,4个象限分别代表了不同的效果评估。

象限一:高点击转化,点击高代表营销创意打动了受众,转化高代表被打动的首众是产品的目标用户。

象限二:高转化低点击,同样的,高点击代表被打动的受众是产品的目标用户,但低点击代表的是营销创意没有打动用户;

象限三:低点击低转化,这个象限是最糟糕的营销活动了,投放广告点击少,点击用户转化低,创意无效,用户不精准;

象限四:高点击低转化,这个象限的营销活动要给策划和文案加鸡腿,但就要给渠道扣绩效了。这种象限的营销活动一定程度上有标题党的嫌疑。

(4)杜邦分析法

杜邦分析法是利用几种主要的财务比率之间的关系来综合地分析企业的财务状况,具体来说,是一种用来评价公司盈利能力和股东权益回报水平,从财务角度评价企业绩效的一种经典方法。

其基本思想是将企业净资产收益率逐级分解为多项财务比率乘积,这样有助于深入分析比较企业经营业绩。

(5)AARRR模型

AARRR是一个用于研究用户增长的数据分析模型,是Acquisition、Activation、Retention、Revenue、Refer这五个单词的缩写,分别对应用户生命周期的用户获取、用户激活、用户存留、获得收益、推荐传播这五个环节。

(6)PEST模型

PEST分析法就是从政治(Political)、经济(Economic)、社会(Society)、技术(Technology)四个方面,基于公司战略的眼光来分析企业外部宏观环境的一种方法。

公司的发展战略与宏观环境息息相关,PEST分析可以更好地把握宏观经济形势和发展趋势,从而更好地把握公司的生存发展机遇,及时发现和规避环境的潜在风险。

(7)RFM模型

RFM模型是指根据客户活跃度和交易金额贡献,进行客户价值细分的一种方法。主要应用于精细化运营、用户分层分析、用户会员体系建立。

根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有三个神奇的要素,这三个要素构成了数据分析最好的指标:

  • 最近一次消费(Recency)
  • 消费频率(Frequency)
  • 消费金额(Monetary)

(8)SWOT模型

SWOT模型分析法代表企业优势(Strength)、劣势(weakness)、机会(opportunity)和威胁(threats)。

SWOT分析实质上是一种综合和总结企业外部环境的各种因素,从而分析企业的优势、劣势、机遇和威胁的一种方法,可以通过分析帮助企业把资源和行动集中在自己的强项和有最多机会的地方。

(9)5W1H模型

Who(分析对象) 确定主题对象

Where(从哪里获取数据)进行数据集成

When(获取哪些时间段的数据)确定时间间隔

What(用什么分析方法)具体的手段方法

Why (什么原因导致的)背景和根本原因

How (如何呈现最终结果)分析报告

1.3.2 将数据应用于业务

1.3.3 将数据应用于算法

相关推荐
Leo.yuan6 小时前
数据量大Excel卡顿严重?选对报表工具提高10倍效率
数据库·数据分析·数据可视化·powerbi
海边散步的蜗牛11 小时前
学术论文写作丨机器学习与深度学习
人工智能·深度学习·机器学习·chatgpt·数据分析·ai写作
数模竞赛Paid answer13 小时前
2023年MathorCup数学建模A题量子计算机在信用评分卡组合优化中的应用解题全过程文档加程序
数学建模·数据分析·mathorcup
康谋自动驾驶14 小时前
康谋分享 | 确保AD/ADAS系统的安全:避免数据泛滥的关键
数据分析·自动驾驶·汽车
幸运小新21 小时前
数据分析-Excel基础操作
数据分析
Moonquake_www1 天前
数据集划分
算法·数据分析
想七想八不如114082 天前
【数据分析与数据挖掘】决策树算法
算法·数据挖掘·数据分析
Python技术极客2 天前
数据分析师必学:Series多层级索引与数据操作技巧
python·数据分析
databook2 天前
『玩转Streamlit』--数据展示组件
python·机器学习·数据分析