文章目录
一、数据分析行业
数据从古至今的应用发展
如下图,在古代就有了结绳计数,主要是对信息的记录
如下图,在18世纪,由于概率理论日益成熟,为统计学的发展奠定了基础。19世纪中叶,把概率论引进统计学而形成数理学派。其奠基人是比利时的阿道夫·凯特勒,被誉为"近代统计学之父",其主要著作有:《论人类》、《概率论书简》、《社会制度》和《社会物理学》等
如下图,现代统计学的发展可以追溯到19世纪末和20世纪初期,随着科学技术和社会变化的迅猛发展,统计学进入了快速发展时期,甚至被称为"统计时代"。20世纪初,统计学的发展得益于优秀统计学家对难题的攻克和对经典的挑战。例如,约翰·格兰特在1674年组织调查伦敦的人口死亡率,并发表了专著《从自然和政治方面观察死亡统计表》,提出了"大数恒静定律",奠定了统计学的数学基础
数据让生活更美好
生活中很多复杂的决策,看上去没有规律可循,实际上是可以用算法来解决的。
很多时候我们沉迷在细节里,看不清大方向,其实是犯了数学上的过度拟合错误。
时间问题本质上是个数学问题,用数学家的办法管理时间,才能活得更有效率。
互联网引动大数据
随着互联网的普及以及越来越便捷,我们从电脑到手机,无处不在的产生数据,像微信还记录这我们每天的走路、消费等等日常生活的数据,这些数据也就引发了大数据的到来
数据化无处不在
未来AI发展趋势
据统计机器人已经替代了工人的比例,每提高千分之一失业的概率就会上升千分之三,城市化比较强的需要投入劳动比较多的一些职业
数据行业的技能金字塔
分析与挖掘
如下图,数据分析是人对数据的主观分析,每个人可能都会有自己主观的看法,需要有较深的行业经验,结合数据做出判断
数据挖掘是把数据给计算机,让计算机自己通过对数据的整理,给出结果进行判断
数据分析的学习思路
数据分析如果是零基础入门, 建议先从理论->工具->场景,进行学习
二、数据分析商业应用
商业智能:数据分析/挖掘*数据理解
目前应用较广的商业智能,主要是业务+数据,通过数据对业务进行分析,并产生商业价值
数据分析的价值
在平时我们做一件事主要凭借过往的价值,而产生数据分析后,我们会通过数据去验证经验是否正确,从而保证决策的准确性。我们可以通过AB测试、市场调研、竞品分析、销售数据,去验证我们的经验或猜想是否正确
作为数据分析师,你的分析必须简明化、结论化、通用化,只有这样无论你的上级、客户、还是其他数据参与方才能够看的懂你的思路和结论
商业智能的常用
数据粒度:主要指数据的量级,是个位数数据,百位还是千万、亿万级别
汇总维度:指从那个维度进行分析,是客群汇总、销售汇总还是产品线
计算字段:指需要哪些数据字段,有的字段过多如不需要可以删除
使用对象:数据主要给谁看,如果高层结论为主,如果中层可能需要过程
应用场景:是销售、生产、人事,主要运用哪些行业,哪些部门
关联行动:需要哪些部门配合,如果将本次数据分析整个流程完整实施
数据展示:通过Powerbi、Excel、帆软、Tablean等进行展示
权限管理:数据会分部分或人员展示,所以需要对相应的人进行展示
刷新频次:数据的更新频率,是按日、周还是月,根据具体情况分析
商业智能能解决什么问题
常见商业场景:战略(总结和创新)
通过数据找到最核心的卖点,并打造爆款。这个战略决策,就是基于数据分析,通过对客群、销售、产品等数据的分析,找到最终的核心战略点
常见商业场景:理解客户(理解和总结)
例如一个金融投资应用数据应用,我们根据客户来源、客户信息等,可以推荐相应符合他水平的投资产品,这样降低他的风险和可接受性。当客户在平台操作后,可以看到他做了什么动作,存入多少钱、做了哪些投资行为等,随着对客户的了解、客户动作的了解等,来对该客户进行分析,进而进行营销、促活、维护及服务
三、数据分析思维
数据的本质
发现和解决问题:现状与期待的落差
数据分析的三种路径
防范风险:预防和应对
如下图,可以用作电商促销补贴分析,像X轴为补贴,Y轴为消费金额.D-左是消费金额大并且补贴力度大的,我们运营人员需要将这群人员的补贴力度慢慢的减少,让他们适应正常的补贴力度,甚至没有补贴力度的常态.在E是补贴力度中等,并且消费少的人群,针对这类人群我们需要试图将这类人消费金额提高,或者将补贴力度减少
追求理想:合理的理想
明确目标->评估价值->规划性思考->行动计划
通用分析思路涉及
在常用的用户增长设计中,我们制定好增长目标后,可以保证一个小幅度的增长,但是一定先保证避免客户的流失和潜在风险.在这前提下,再试图去追求理想目标
数据分析的四个层次
- 战略规划:内外部数据结合,长期规划的过程.注重方向判断,弱化细节预测.
- 策略分解:根据战略和目标,拆解为可以执行的层面,注重KPI设定.
- 市场营销:活动和获客驱动,注重成本核算,效果预测和事后评估.
- 业务运营:关注日常数据,注重监控预警和分析发现.
四、数据分析常用方法
结构化的分析方法
事实+前提+逻辑=观点
- 事实:客观的存在,是百分之百成立的
- 前提:做出推断的依据,是不需要证明的公理
- 逻辑:作出推理的规则,本质上是数学
- 结论:最后得到的观点
事实的提炼:现实的抽象化
收集型的数据:正常业务自然产生的数据
可以把定性部分看我们数据中的维度,定量部分看作数分中的具体数值
金字塔逻辑分析
当我们拿到一大堆数据,可以根据时间,空间,程度等维度进行拆分,层层进行推进,将一个大前提,拆解为许多小前提,最后得出一个结论
矩阵分析:陌生行业的分析路径
- 构建坐标系:两个变量(因素)
- 选择原点:离散(高/低),连续(中位数/平均值)
- 四象限:问题的解剖
- 制定策略:依象限而定