【数据分析】数据分析行业

文章目录

一、数据分析行业

数据从古至今的应用发展

如下图,在古代就有了结绳计数,主要是对信息的记录

如下图,在18世纪,由于概率理论日益成熟,为统计学的发展奠定了基础。19世纪中叶,把概率论引进统计学而形成数理学派。其奠基人是比利时的阿道夫·凯特勒,被誉为"近代统计学之父",其主要著作有:《论人类》、《概率论书简》、《社会制度》和《社会物理学》等

‌如下图,现代统计学的发展‌可以追溯到19世纪末和20世纪初期,随着科学技术和社会变化的迅猛发展,统计学进入了快速发展时期,甚至被称为"统计时代"。20世纪初,统计学的发展得益于优秀统计学家对难题的攻克和对经典的挑战。例如,约翰·格兰特在1674年组织调查伦敦的人口死亡率,并发表了专著《从自然和政治方面观察死亡统计表》,提出了"大数恒静定律",奠定了统计学的数学基础

数据让生活更美好

生活中很多复杂的决策,看上去没有规律可循,实际上是可以用算法来解决的。

很多时候我们沉迷在细节里,看不清大方向,其实是犯了数学上的过度拟合错误。

时间问题本质上是个数学问题,用数学家的办法管理时间,才能活得更有效率。

互联网引动大数据

随着互联网的普及以及越来越便捷,我们从电脑到手机,无处不在的产生数据,像微信还记录这我们每天的走路、消费等等日常生活的数据,这些数据也就引发了大数据的到来

数据化无处不在

未来AI发展趋势

据统计机器人已经替代了工人的比例,每提高千分之一失业的概率就会上升千分之三,城市化比较强的需要投入劳动比较多的一些职业

数据行业的技能金字塔

分析与挖掘

如下图,数据分析是人对数据的主观分析,每个人可能都会有自己主观的看法,需要有较深的行业经验,结合数据做出判断

数据挖掘是把数据给计算机,让计算机自己通过对数据的整理,给出结果进行判断

数据分析的学习思路

数据分析如果是零基础入门, 建议先从理论->工具->场景,进行学习

二、数据分析商业应用

商业智能:数据分析/挖掘*数据理解

目前应用较广的商业智能,主要是业务+数据,通过数据对业务进行分析,并产生商业价值

数据分析的价值

在平时我们做一件事主要凭借过往的价值,而产生数据分析后,我们会通过数据去验证经验是否正确,从而保证决策的准确性。我们可以通过AB测试、市场调研、竞品分析、销售数据,去验证我们的经验或猜想是否正确

作为数据分析师,你的分析必须简明化、结论化、通用化,只有这样无论你的上级、客户、还是其他数据参与方才能够看的懂你的思路和结论

商业智能的常用

数据粒度:主要指数据的量级,是个位数数据,百位还是千万、亿万级别

汇总维度:指从那个维度进行分析,是客群汇总、销售汇总还是产品线

计算字段:指需要哪些数据字段,有的字段过多如不需要可以删除

使用对象:数据主要给谁看,如果高层结论为主,如果中层可能需要过程

应用场景:是销售、生产、人事,主要运用哪些行业,哪些部门

关联行动:需要哪些部门配合,如果将本次数据分析整个流程完整实施

数据展示:通过Powerbi、Excel、帆软、Tablean等进行展示

权限管理:数据会分部分或人员展示,所以需要对相应的人进行展示

刷新频次:数据的更新频率,是按日、周还是月,根据具体情况分析

商业智能能解决什么问题

常见商业场景:战略(总结和创新)

通过数据找到最核心的卖点,并打造爆款。这个战略决策,就是基于数据分析,通过对客群、销售、产品等数据的分析,找到最终的核心战略点

常见商业场景:理解客户(理解和总结)

例如一个金融投资应用数据应用,我们根据客户来源、客户信息等,可以推荐相应符合他水平的投资产品,这样降低他的风险和可接受性。当客户在平台操作后,可以看到他做了什么动作,存入多少钱、做了哪些投资行为等,随着对客户的了解、客户动作的了解等,来对该客户进行分析,进而进行营销、促活、维护及服务

三、数据分析思维

数据的本质

发现和解决问题:现状与期待的落差

数据分析的三种路径

防范风险:预防和应对

如下图,可以用作电商促销补贴分析,像X轴为补贴,Y轴为消费金额.D-左是消费金额大并且补贴力度大的,我们运营人员需要将这群人员的补贴力度慢慢的减少,让他们适应正常的补贴力度,甚至没有补贴力度的常态.在E是补贴力度中等,并且消费少的人群,针对这类人群我们需要试图将这类人消费金额提高,或者将补贴力度减少

追求理想:合理的理想

明确目标->评估价值->规划性思考->行动计划

通用分析思路涉及

在常用的用户增长设计中,我们制定好增长目标后,可以保证一个小幅度的增长,但是一定先保证避免客户的流失和潜在风险.在这前提下,再试图去追求理想目标

数据分析的四个层次

  • 战略规划:内外部数据结合,长期规划的过程.注重方向判断,弱化细节预测.
  • 策略分解:根据战略和目标,拆解为可以执行的层面,注重KPI设定.
  • 市场营销:活动和获客驱动,注重成本核算,效果预测和事后评估.
  • 业务运营:关注日常数据,注重监控预警和分析发现.

四、数据分析常用方法

结构化的分析方法

事实+前提+逻辑=观点

  1. 事实:客观的存在,是百分之百成立的
  2. 前提:做出推断的依据,是不需要证明的公理
  3. 逻辑:作出推理的规则,本质上是数学
  4. 结论:最后得到的观点

事实的提炼:现实的抽象化

收集型的数据:正常业务自然产生的数据

可以把定性部分看我们数据中的维度,定量部分看作数分中的具体数值

金字塔逻辑分析

当我们拿到一大堆数据,可以根据时间,空间,程度等维度进行拆分,层层进行推进,将一个大前提,拆解为许多小前提,最后得出一个结论

矩阵分析:陌生行业的分析路径

  1. 构建坐标系:两个变量(因素)
  2. 选择原点:离散(高/低),连续(中位数/平均值)
  3. 四象限:问题的解剖
  4. 制定策略:依象限而定
相关推荐
星川皆无恙3 小时前
大数据产品销售数据分析:基于Python机器学习产品销售数据爬虫可视化分析预测系统设计与实现
大数据·运维·爬虫·python·机器学习·数据分析·系统架构
学术交流3 小时前
2025年软件工程与数据挖掘国际会议(SEDM 2025)
论文阅读·人工智能·数据挖掘·软件工程·论文笔记
AI科技分享7 小时前
数据中台产品功能介绍
信息可视化·数据挖掘·数据分析
没有梦想的咸鱼185-1037-16637 小时前
【大语言模型ChatGPT+Python】近红外光谱数据分析及机器学习与深度学习建模(近红外光谱数据分析、定性/定量分析模型代码自动生成等)
python·深度学习·机器学习·语言模型·chatgpt·数据分析
lilye668 小时前
精益数据分析(44/126):深度解析媒体网站商业模式的关键要点
数据挖掘·数据分析·媒体
我不是小upper10 小时前
Jupyter Notebook为什么适合数据分析?
ide·jupyter·数据分析
get lend gua16 小时前
Pandas 的透视与逆透视
机器学习·数据挖掘·pandas
kngines17 小时前
【PostgreSQL数据分析实战:从数据清洗到可视化全流程】3.2 缺失值检测与处理(NULL值填充/删除策略)
postgresql·数据分析·显示缺失·隐性缺失·逻辑缺失·时间序列填充·缺失填充
Dovis(誓平步青云)19 小时前
智能推理DeepSeek-R1+Word深度整合业级智能办公构建
人工智能·深度学习·机器学习·语言模型·数据挖掘·word
kngines1 天前
【PostgreSQL数据分析实战:从数据清洗到可视化全流程】3.3 异常值识别(Z-score法/IQR法/业务规则法)
数据库·postgresql·数据分析·z-score法·iqr法·业务规则法