数据分析-----方法论

什么是数据分析方法

数据分析方法:将零散的想法和经验整理成有条理的、系统的思路,从而快速地解决问题。

案例:

用户活跃度下降

想法:

  1. APP出现问题?
  2. 去年也下降了吗?
  3. 是所有的人群都在下降吗?

总结归纳:

数据分析方法----细分法

用户拆分:DAU=新用户+老用户

时间拆分:DAU=0点活跃数+1点活跃数+...

地区拆分:DAU=北京活跃数+上海活跃数+....

营销管理方法论

SWOT分析:来自企业管理理论中的战略性规划。

SWOT分析即态势分析,是指将与研究对象相关的内部优势、劣势、机会、威胁,通过调查列举出来。

  1. Strengths(优势):产品的优势是什么,有什么地方比竞品更有竞争力。做优势分析,可以清晰地知道自己产品的优势在哪里,以便更好地发挥优势。
  2. Weakness(劣势):产品的劣势是什么,比起竞品,自己的产品有什么不足,这些不足是否影响到了市场份额,这些不足怎样通过产品选代和优化去改善。
  3. ·Opportunity(机会):产品的未来有什么会,用户现有的痛点是否有我们可以利用的机会。
  4. ·Treats(威胁):现在产品面临的外部威胁是什么,这些威胁是什么原因造成的,我们该怎么去解决它。

OSM模型是一种数据运营的模型

它是三个英文单词的缩写:Object(目标),Strategy(策略),Measurement(度量)。

  1. Object(目标):明确你的业务目标是什么,这是你做数据分析的前提。没有明确的目标,你的数据分析工作就没有方向。
  2. Strategy(策略):为了达到你的业务目标,你需要制定出相应的策略。这个策略应该包括你打算如何收集和处理数据,以及你打算如何使用这些数据来帮助你达到你的业务目标。 3. Measurement(度量):你需要设定一些关键性能指标(KPI)来衡量你的策略是否有效。这些指标应该是可量化的,这样你就可以通过数据来跟踪你的进度。

当然,让我们通过一个简化的例子来具体演示OSM模型是如何在数据分析中应用的。

场景设定

假设你是一家电商公司的数据分析负责人,公司的目标是提高网站的月销售额。

第一步:Object(目标) 明确业务目标:

  • 提高网站月销售额。 为了简化讨论,假设当前月销售额为100万美元,目标是在下个季度增长到150万美元。

第二步:Strategy(策略) 制定策略和行动计划:

  1. 用户行为分析 - 分析用户在网站上的行为,了解购买流程中的退出点。
  2. 产品推荐优化- 利用机器学习算法优化推荐系统,向用户推荐潜在感兴趣的商品。
  3. 营销活动- 设计针对性的营销活动,比如优惠券、限时折扣等,以提高转化率。
  4. 客户服务改进 - 提高客户服务质量,减少购物车放弃率。

第三步:Measurement(度量) 确定关键性能指标(KPIs):

  • 月销售额 - 网站访问量 - 转化率 - 平均订单价值(AOV) - 购物车放弃率 - 客户满意度评分实施与监控

接下来,开始执行策略并定期监控关键性能指标。

例如,你可能会每周检查销售数据,以了解是否朝着150万美元的目标前进。

数据分析 进行数据分析以评估策略的效果: - 使用统计分析来确定哪些营销活动最有效。 - 分析用户行为数据,以优化网站布局和用户界面。 - 对购物车放弃率进行深入分析,找出原因并制定解决方案。

调整策略 根据分析结果,调整策略: - 如果某个营销活动的ROI(投资回报率)很高,可能会增加该活动的预算。

  • 如果发现某个页面的退出率高,可能需要重新设计该页面。 - 如果客户反馈显示对客服不满意,可能需要提供更多的培训或改进客服流程。

结果评估 在月底,评估整体表现,看是否达到了目标。如果没有达到目标,分析原因,并在下个月调整策略。如果达到了目标,考虑设定更高的目标或寻找新的增长机会。

数据分析之4P理论:

4P主要是产品(product)、渠道(Place)、价格(Price)、推广(Promotion)

  1. 产品(Product) :产品是企业提供给市场的核心,它可以是有形的商品,也可以是无形的服务或者技术、知识等。产品的设计和开发应基于市场需求,满足消费者的特定需求和偏好。

企业的营销负责人在策划一个产品时,需要考虑这个产品解决了什么需求,卖给谁,有什么功能,它跟竞争对手的产品有什么差异,有时候还需要产品是否做单品爆款,还是要做各种产品线的组合,以面对市场上的各种竞争。

  1. 渠道(Place):渠道主要是指可以触达到用户的地方。渠道涉及产品的分销和销售渠道,包括实体店铺、电商平台、直销等。选择合适的销售渠道对于产品的市场覆盖和消费者购买便利性至关重要。通过数据分析,企业可以了解各个渠道的销售效率,优化渠道结构,提高渠道管理的效率
  2. 价格(price):指用户在购买产品时的价格,包括折扣、支付期限等。价格是产品价值的货币表现,它直接影响企业的销售收入和利润。合理的定价策略能够吸引目标消费者,提高市场竞争力。数据分析可以用于评估不同价格点对销量的影响,分析消费者对价格变动的敏感度,从而帮助企业制定有效的定价策略。
  3. 推广(Promotion):推广是通过广告、公关活动、销售促进等方式来提高产品知名度和吸引消费者的手段。数据分析可以帮助企业评估推广活动的效果,如品牌知名度、广告点击率、促销活动的转化率等,从而调整推广策略,提高投资回报率。

常用数据分析方法论及应用

对比细分:

  • 对比分析 :是一种通过比较两个或多个具有可比性的数据来分析差异的方法,目的是为了揭示事物的发展规律或者趋势。例如,将一个公司的年度销售数据与前一年度的数据进行对比,可以直观地展示业务的增长或衰退情况。
  • 细分分析 :则是在多维数据中按照不同的角度进行数据提取和拆分,以找到数据变化的具体原因。例如,如果在整体销量表现良好的情况下,某个地区或某个时间段的销量却出现了下降,这就需要通过细分分析来探究背后的原因。

此外,在进行对比细分时,通常会采用以下方法:

  • 时间序列分析 :比较同一指标在不同时间点的数据,如季度销售额、月度用户活跃度等,以此来观察趋势和周期性变化。
  • 地理区域分析 :按地理位置对数据进行细分,比如分析不同城市或地区的销售情况,找出地区市场的差异。
  • 客户群体分析 :根据客户的特征如年龄、性别、消费习惯等进行分组,分析不同群体的行为差异。
  • 产品类别分析 :将销售或用户数据按照产品类型进行细分,了解各类产品的市场表现。

退货处理时效

1. 响应效率 :商家应在消费者发起退款申请后的30分钟内进行响应,这样可以提升买家体验并节省沟通成本。

2. 7天无理由退货 :许多电商平台提供"7天无理由退货"服务,即消费者在签收商品之日起7个自然日内,若商品完好无损,可以申请无理由退货。

3. 退款时效 :一般情况下,商家在同意退款后,退款会在3个工作日内处理完成。具体到账时间还取决于支付渠道的处理速度,例如支付宝退款通常会相对较快。

4. 退货退款时效 :如果消费者申请退货退款,需要先将商品寄回给卖家,并经过卖家确认后进行退款。整个过程包括邮寄时间、卖家确认时间和退款处理时间,具体时效会因物流速度和卖家处理速度等因素而有所不同。

5. 换货时效 :对于换货请求,同样需要将商品寄回给卖家,并经过卖家确认后进行换货处理。整个过程的时间也包括邮寄时间、卖家确认时间和换货处理时间。

回款金额

回款金额通常指的是企业在销售产品或提供服务后从客户那里收回的款项

具体包括以下几个方面:

1. 销售收入 :企业通过销售产品或提供服务获得的货币收入,这是企业经营活动的主要收入来源。

2. 代销形式 :在一些销售模式中,如代销,企业可能不会立即收到全部款项,而是通过打欠条的方式,约定在将来的某个时间点收回款项,这部分定期回收的款项也称为回款。

3. 资金流动 :回款是企业资金流动的一种形式,它对于企业的现金流管理至关重要。企业需要通过有效的回款管理来确保资金链的稳定性,以支持日常运营和再投资的需求。

4. 成本与利润 :为了获取回款,企业需要承担一定的成本,包括生产成本、销售成本、管理成本等。回款金额减去这些成本后,剩余的部分即为企业的回款利润。

生命周期分析法:

生命周期分析法是一种将对象从产生到消亡的过程划分为不同阶段的分析方法 ,它通常用于评估产品、企业或项目的发展过程。

流失周期

一般分为两种方法:分位数法和拐点法

  1. 分位数:也称分位点,是指将一个随机变量的概率分布范围为几等份的数值点,分析其数据的变量的趋势,常用的有中位数、四分位数、百分位数。

如何通过分位数的方法计算用户的流失周期呢?

首先需要计算用户的活跃时间间隔。例如,如果用户A的活跃日期分别是2020年12月1日和2020年12月14日,那么该用户的活跃间隔为13天。我们把所有用户的活跃时间间隔都计算好,然后找到间隔的90%分位数。

通过对所有用户进行同样的处理,我们可以得到一个时间间隔的分布。然后,利用分位数将这个分布划分为几个等份,每个等份代表一个特定的时间区间。这些分位数可以帮助我们识别出在特定时间段内可能发生用户流失的模式。

为什么是90%分位数呢?这是因为如果有90%的活跃时间间隔都在某个周期以内,那么这个周期内不活跃,之后活跃的可能性也不高。

  1. 拐点法:此方法侧重于分析用户行为数据中的突变点,即所谓的"拐点"。在这些点上,用户流失的风险可能会有显著的增加。通过识别这些关键的时间点,可以更准确地预测用户何时可能会流失,并据此采取预防措施。

RFM模型:

1.R表示最后一次付费日期距离现在的天数,R用来刻画用户的忠诚度,一般来说,R值越小,表示用户的忠诚度越高。

2.F表示一段时间内的付费频次,用于刻画用户付费行为的活跃度。通常,频率越高,表明客户对品牌的忠诚度越高。但在实际应用中,由于产品类别的不同,比如电子产品等,可能不会频繁复购,因此有时会将F值的时间范围去掉,替换成累计购买次数。

3.M表示一段时间内的付费金额,金额越高,表明客户的价值越大。

根据R、F、M的值,可以把用户划分为以下类别

相关性分析 是一种统计方法,用于确定两个或多个变量之间的关系程度.相关性元素之间需要有一定的联系,才可以进行相关性分析。

相关性大小用相关系数R来描述。

  1. 正相关
  2. 负相关
  3. 无线性相关

用户画像分析

1.什么是用户的画像分析

我们经常在淘宝网站购物,作为淘宝方,他们想要知道用户是什么样的,年龄、性别、城市、收入、购物品牌偏好、购物类型、平时的活跃程度等,这样的一个用户描述就是用户画像分析。

2.用户画像分析的作用

1.广告投放:

在做用户增长时,我们需要在一些外部渠道投放广告,吸引可能的潜在用户,我们在选择平台进行投放时,有了用户画像分析,就可以精准的进行广告投放。

2.精准营销:

根据用户画像分析进行划分出不同的用户群体,例如用户在某电商平台使用优惠卷与付费次数之间的关系,公司利用不同的付费次数发放不同的优惠卷。

3.个性化推荐:

现在市面上最典型的例子:抖音短视频会根据用户的喜好推荐相关的视频,音乐类APP会有每日推荐歌曲等

4.风控检测:

主要是金融或银行涉及的比较多,常见的问题就是银行怎么决定是否放贷给申请人。例如:会搭建一个风控检测模型,预测申请人是否有可能不还款等情况。

5.产品设计:

企业做一个产品前,都要明确几个问题:

  • 产品面向什么人群
  • 他们的使用环境如何
  • 能为用户解决什么问题
  • 还有产品的功能、特色是什么
  • 和竞争对手的差别是什么
  • 企业想从中获得什么
  1. 数据分析:用户画像分析可以帮助数据分析师更加清晰的刻画用户。

如何构建用户画像

  1. 数据层

进行数据画像分析的基础就是获取完整的数据,互联网数据主要是利用打点,也就是通常的数据埋点上报。

  1. 挖掘层:

有了基础数据以后,就进入挖掘层,挖掘主要做两件事,一个是数据仓库的构建,另一个是标签的预测,前者是后者的基础。

一般来说,我们会根据数据层数据表,对这些数据表的数据进行清洗、汇总,然后按照数据仓库的分层思想,比如按照数据原始层、数据清洗层、数据汇总层、数据应用层等进行表的设计。

1.数据原始层(ODS):是上报的数据,没有进过数据清洗处理,是最外层的用户明细数据。

2.数据清洗层(DWD):原始数据进过简单清洗之后的数据,与去除'脏'数据等明显异常的数据。

3.数据汇总层(DWS):是根据数据分析的需求,针对想要的业务指标(比如,时长,歌曲数等),按照用户维度把用户进行聚合,得到用户的轻量指标的聚合表。主要是可以快速的汇总数据。

4.数据应用层(APP):主要面向业务方的需求进行加工,可能是在数据汇总的基础上加工成对应的指标需求,比如:每天的听歌人数,次数,时长等。

3.服务层

有了数据层和挖掘层,用户画像体系基本形成,那么就到了用户画像的赋能的阶段。

最基础的应用就是利用用户画像宽表数据,对用户行为进行洞察,挖掘行为和属性特征的规律。

  1. 用户提取:利用用户画像平台,快速提取用户数据
  2. 分群对比:可以利用用户画像平台进行分群对比
  3. 功能画像分析:可以利用用户画像平台快速进行某个功能的用户画像描述分析。

Aha时刻

什么是aha 时刻

Aha时刻也叫惊喜时刻,是用户第一次认识到产品价值时,脱口而出"啊哈,原来这个产品可以帮我做这个啊。"简单来说就是用户第一次使用时候的惊喜体验。

Aha时刻主要发生在用户激活阶段,它是用户激活的关键。当用户被吸引来,并不是所有都会转化成活跃用户,但如果用户获得Aha时刻,即从产品中发现了价值,就会顺利转化成活跃用户,而且较容易转化成粘性较高的忠诚用户。

Aha时刻也并不是虚无缥缈的,他有一些具体的规律:清晰、具体、可量化。总的来说,他可以用一句话来描述:(谁)在(多长时间内)完成(多少次)(什么行为)?

以下列举出几个代表性APP的用户Aha时刻:

支付宝,7天内稳定使用支付宝3个以上的功能。

Faceu激萌,一天利用滤镜完成1张照片的美化。

Airbnb,6个月时间完成首次订单,并且有4星以上评价

aha 时刻的价值

单个用户在产品中的生命周期包含四个阶段,拉新 -> 激活 -> 留存 -> 流失, 由于现在拉新的成本越来越大, 所以我们希望的是拉来一个用户, 他们都能够尽可能的留下来, 所以拉承一体化的打法非常重要。

不当当是把用户从渠道利用采买的方法拉过来, 同时要做好用户来到我们app 上的承接, 那么怎么做做承接呢, 就需要针对用户进行相对应的aha 时刻的分析, 去发现留存的aha时刻

当我们找到用户的aha 时刻, 我们就可以针对性的引导用户去让他们达到他们的aha 时刻, 从而提高相应的留存

比如我们玩抖音的时候, 通过数据分析发现 7天内 用滤镜拍了 三个视频的用户的留存率会大大提高, 那么作为产品经理就可以去引导用户多用滤镜去拍视频, 同时对于滤镜本身的功能我们也可以相对应的进行优化。

如何挖掘aha 时刻

  1. 特征行为提取

拿某直播app 作为例子, 与留存的相关的行为可以分为 登录行为, 观看行为, 弹幕行为, 付费行为, 然后在每一个大的行为分类进行小的指标的刻画。

比如去描述登录的行为我们就可以用 30天登录天数, 7天登录天数, 还可以用比率型指标, 像最近30天的登录天数和过去30天的登录的天数的比值, 这个反应了用户活跃度的变化

  1. 相关性分析

我们以y=1 表示用户留存, 0 表示用户不留存(流失),这样每一个用户就可以用0 和1 表示他留不留存下来

同时我们把用户的每一个行为特征都用具体的数字去量化出来, 比如用户的观看行为, 我们就可以用30天每天的平均观看时长来表示, 观看时长越长可能就代表用户对直播的app 越感兴趣,

同样的其他的数据, 比如发弹幕等等也是从其他维度去刻画用户的行为特征, 那么我们就可以得到比如用户 a, 30天观看天数XX天, 日均观看时长xx 分钟, 是否留存, 这样很多行的数据.

每一个用户一行, 然后我们就可以用之前的讲过的相关性分析的方法,去挖掘哪些行为和留存相关, 因为挖掘用户aha moment 的前提是要保证这些行为是跟我们研究的留存是有关系的。

  1. aha moment 的计算

发现了影响留存了原因以后, 我们就要寻找这些行为是达到一个怎么样的值以后, 会大大影响留存的概率, 所以我们计算了30天登录天数, 7天登录天数, 月日均观看时长, 30天观看主播数, 30天观看品类数和留存的关系

  1. 业务价值

当我们找到用户的aha moment 的时候, 我们就要跟产品或者运营一起讨论沟通, 如何通过现在端内一些产品的功能的优化提高用户的登录天数, 观看主播数等等。

相关推荐
statistican_ABin26 分钟前
R语言数据分析案例45-全国汽车销售数据分析(可视化与回归分析)
数据挖掘·数据分析
CV学术叫叫兽2 小时前
快速图像识别:落叶植物叶片分类
人工智能·分类·数据挖掘
网络真危险!!2 小时前
【数据分析】认清、明确
数据挖掘·数据分析
菜鸟的人工智能之路2 小时前
极坐标气泡图:医学数据分析的可视化新视角
python·数据分析·健康医疗
菜鸟学Python2 小时前
Python 数据分析核心库大全!
开发语言·python·数据挖掘·数据分析
EterNity_TiMe_3 小时前
【论文复现】(CLIP)文本也能和图像配对
python·学习·算法·性能优化·数据分析·clip
CV学术叫叫兽3 小时前
一站式学习:害虫识别与分类图像分割
学习·分类·数据挖掘
HPC_fac130520678168 小时前
以科学计算为切入点:剖析英伟达服务器过热难题
服务器·人工智能·深度学习·机器学习·计算机视觉·数据挖掘·gpu算力
wxl78122716 小时前
如何使用本地大模型做数据分析
python·数据挖掘·数据分析·代码解释器
小尤笔记17 小时前
利用Python编写简单登录系统
开发语言·python·数据分析·python基础