为了服务于企业不同层次的决策,商业数据分析过程需要提供相应的数据科学产出物。
一般而言,数据分析需要经历从需求层、数据层、分析层到输出层四个阶段。
- 第一个阶段是需求层------确定目标,具体目标需要依据具体的层次进行分析:如果是战略管理层面的分析,则主要集中在行业发展或者产品未来市场等;如果是管理和运营层面的分析,则主要集中在产能情况、财务状况、业务运营等;如果是操作层面的分析,它主要是集中在客户画像、客户倾向性等。所以,不同层面的分析需求是不一样的,分析目标也就不同。
- 第二个阶段数据层面主要包括数据的获取、清洗和整理。虽然目标方向和所在层次不同,但是在数据层的处理流程十分相似。
- 第三个阶段分析层,需要用到统计分析、用户画像等技术。我们结合业界实践归纳出商业分析模型、归因分析模型、算法模型作为模板以便于读者更快的搭建不同的数据分析框架。
- 第四个阶段是输出物,以战略分析报告、仪表盘、业务归因分析报告和数据挖掘报告的形式输出,其中战略分析报告主要是面向战略层面,仪表盘主要是面向管理层面,业务归因分析报告主要面向运营管理者,数据挖掘报告面向业务执行和操作人员。
接下来通过一个示例来加深理解,比如领导想知道广告投放效果如何,这就需要我们对营销效果进行评估。可以通过对比广告投放之前与之后销售量的变化来评价广告的效果,简单的描述统计即可做到。但是领导又会追问:"销售量的提升真的与这次广告的投放有关系吗?而不是受到外面的经济环境影响?"为了回答这个问题,我们需要从业务宏观层面分析,从而明确广告投放是否为销售增长的原因。这时,简单的描述分析就不足以回答这个问题了,还要用到统计分析中的实验设计、假设检验等工具。通过控制其他影响销售的因素,并结合假设检验方法可以发现,广告费用投入之后确实导致了销售收入的显著提升,因此可以说广告投入是本次销售增长的原因。但是,如果我们想弄清楚广告到底是在哪个渠道、哪些产品或者哪些人群中才会发挥出更佳效果,就需要进行微观层面分析。首先要结合客户的性别、年龄、地域、喜好等标签进行客户画像的分析。
然后通过对微观层面的模型归因分析,制定出业务归因分析与优化策略报告,这也是面向运营层面的应用。最后根据分析结果,制定精准营销策略。针对不同的客户实现不同的广告投放策略,需要借助算法模型。这里需要用到的是数据挖掘相关算法,深度分析每个客户的喜好,建立模型进行预测。而最终形成的数据挖掘报告是由操作层实施,即办事人员协同进行业务分析和判断,保证报告符合业务人员认知。之后就要实现具体的模型落地,也就是面向 IT 层面由技术人员实施。
数据分析的分类
数据科学的方法层级可分为描述性分析,诊断性分析,预测性分析,规范性分析。
- 描述性分析(Descriptive Analysis):描述性分析旨在对数据进行总结和描述,以了解数据反应的业务运行的基本特征、趋势和分布情况。它包括统计指标、图表和可视化等方法,帮助人们获得对业务运行状况的整体认识。如常见的已经发生的业务事实的分析,日常分析,各种周期性的总结复盘性分析等。
- 诊断性分析(Diagnostic Analysis):诊断性分析旨在探索数据中发生的事件或现象的原因和关联。它通过深入挖掘数据反应的业务运行之间的关系,寻找潜在的因果关系和影响因素,以解释为什么某些情况发生。常见的有业务的异常检测,效果评估,影响性分析等。
- 预测性分析(Predictive Analysis):预测性分析基于历史数据和模型,通过建立预测模型来预测未来事件或趋势。它利用统计建模、机器学习和数据挖掘技术,分析数据中的模式和趋势,以便预测未来可能发生的情况。常见的如销售预测,用户行为预测,股票市场预测,供应链管理预测等。
- 规范性分析(Prescriptive Analysis):规范性分析是在预测性分析的基础上进一步发展而来的,它不仅预测未来情况,还提供了针对不同情况的行动建议和决策支持。规范性分析基于优化方法和决策科学,帮助决策者制定最佳决策方案。如贷款利率定价中基于用户的违约概率给出最优的利率建议,就属于规范性分析的范畴。
商业数据分析的思维框架EDIT
在商业环境下做数据分析常常会综合运用数据科学的四种分析方法中的部分或全部方法,如企业中的战略分析报告和日常管理、运营报告用描述性分析即可,运营流程优化和产品参数优化建议报告需要使用描述性和诊断性分析方法,精准营销、精细化风控等操作层面的报告往往会依次用到以上四种分析方法。为了便于在实际工作中有章可循,可以参考"EDIT"商业数据科学应用框架。
EDIT 数字化模型主要包括探索(Exploration)、诊断(Diagnosis)、指导 (Instruction)和工具(Tool)4个部分。其中外环的 E、D、I 3个部分由企业业务岗位的人员执行,中心T部分由技术部门人员提供数据和工具的支持。
业务运行探索(E)
业务运行探索关注各个项目的运行状态、各项指标是否合规及各项业务的具体数据等。常常使用可视化的形式来展示业务运行状态。例如,我们可以首先基于KPI和业务实践来构建精益化的指标体系,然后输出业务运营监控看板。这种看板类似于飞机的驾驶仪表盘,可以实时显示企业的业务运行状态。
问题原因诊断(D)
当业务指标异常时,采用定性和定量相结合的方式,在中、微观层面定位和分析问题。用数据分析的语言来说,就是识别出到底是哪些因素显著影响了该业务指标的变化。
业务策略指导(I)
在确定业务目标后,我们可以引入数字化的方法来更好地指导优化业务策略。 例如,可以根据用户画像的结果来给不同类型的用户群体分别投放营销资源。这里,我们需要借助知识库、策略库和流程模板,快速地制定优化策略。
数据算法工具(T)
数字化工具分为两个部分:数据工具和算法工具。数据工具(如数据库)从数据角度出发,整合企业的主数据、交易数据、分析数据和参考数据,为数据应用提供数据基础。算法工具(如机器学习算法)是 EDIT 数字化模型的发动机,服务于价值经营、客群运营、全面质量管理、全面风险管理等各个方面。