数据分析题面试题系列2

一.如何估算星巴克一天的营业额

a.需求澄清：区域？节假日？产品范围？

b.收入=销售杯数*单价=（营业时间*每小时产能*每小时产能利用率）*平均单价

Hypo该星巴克门店的营业时间为12小时（取整），忙时4h，闲时8h，制作一杯饮料时长3min，一小时最大生产量60/3*2=40杯（两台机器）

③Calculation（数据计算）：

平均单价=20元*10%+35元*80%+40元*10%≈34元

高峰销售总额=4h*40杯*100%（转换率）*34=5440元

低峰销售总额=8h*40杯*80%（转换率）*34=8704元

合计=高峰销售总额+低峰销售总额=14144元

二.

总结是分功能和内容两方面阐述

产品近期新老用户流失率均较高，你觉得可能是什么原因？数据侧又可以做哪些事情？

考虑因素有哪些：季节、地域、ui、单价、信息、用户习惯改变

3、比较两种方案哪个好：以到底是买一送一好还是五折好的案例为标准

1.确立业务机制、分析对象、业务目标、分析目标

2.确立好可量化的短期和长期目标

3.将指标量化成两个方案可比较的公式

4.分析出影响因素（价格、时长）可以分新老用户考虑

5.总结影响因素和比较指标之间的关系（比如新用户越多，价格越低，活动越有吸引力）

6.考虑实践，分类讨论给结论，可以做AB测试，分可以按不同客群给策略和不可以按不同客群给策略来做（注意两种尽量都做一遍，方便复盘）

3、

针对简历中提到的指标异常分析，你是如何定义指标异常的？

🔻 回答思路参考：

结合我过往经历，我认为指标异常整体分为三大部分，即明确异常定义、异常识别做法、异常处理方式:

首先，明确异常定义，建立标准后才能判断指标是否异常，一共分为2个步骤：

调研现状，了解基线，常用的方式有：

分析业务历史数据来了解指标的正常范围；

参考行业标准或竞争对手的数据作为基线。

设定阈值，建立标准，常用的方式有：

统计方法：使用统计方法（如平均值、标准差、四分位数范围）来设定正常值的范围。

人工规则：例如根据业务逻辑、经验、kpi等来设定阈值。

⚠️注意点：

这里同时需要by简历经历背景，谈观点和实际做法，如果仅是如上描述，就是八股文背诵，缺乏可信度和区分度。

其次，异常识别方法，有了标准后可以根据现状做监控和判断，常用的方法有3类：

图示法：例如

箱线图：通过箱线图可视化数据分布，超出箱型图"胡须"的点通常被认为是异常值。

散点图：在变量之间绘制散点图，观察是否有远离大多数点的离群点。

描述性统计方法：例如

3sigma原则：结合历史数据计算指标的均值方差，构建3sigma区间

四分位数和IQR：使用四分位数范围（IQR）来定义正常值的范围，通常认为低于Q1-1.5IQR或高于Q3+1.5IQR的点是异常。

基于距离/密度/聚类判断法：常见有k-最近邻、LOF、DBSCAN、孤立森林。

⚠️注意点：

这里同时需要结合具体经历做细节过程做法的展开，提高经历的区分度。

最后，异常处理方式，也就是识别指标异常后，要做进一步归因分析+论证、以及经验沉淀，这里：

针对归因分析，主要分为2个部分：

找根因：主要是结合指标构成+业务可落地方向做维度下钻，计算贡献度找根因，例如：xxx...⚠️注意：这里可以结合简历中实际经历信息，做具体分析思路过程的展开。

验效果：针对上述找到的问题，严谨且完整的分析需要进一步确认异常是否由因素变化引起，如果策略有调整异常是否恢复等等

针对沉淀部分，主要是为了提高后续监控和归因效率，主要分为2方面：

是否有必要归纳到自动化工具做监控、产出根因报告，方便业务能够及时根据异常情况调整业务策略。

以及，针对异常出现的严重性，评估异常对业务的影响程度。对于非常重要的指标，可以进一步考虑利用模型提前预测，尤其针对时序数据，可以做异常判别模型，达到提前报警介入的目的

4.你觉得小红书产品有什么可以优化的地方

a.聊使用感受

b不要按个人感受去提改进建议，因为可能商业模式不是你理解的那样，这就需要提前去检索它的商业模式（搞清规模体量、用户特征、发展阶段、竞争格局、竞对的优劣势、当下业务策略以及方向）

c重点说这个岗位方向的优化点

d类似过往经历补充

5.业务要上线新主播首次开播的教学引导，如何评估效果

步骤：定义问题-数据模型-汇报可视化

1、教学功能是否得到使用（曝光率、观看进度、市场）

2、看完之后效果怎么样，直接效果：有多少人成功开播/教学内容应用情况（使用率、频次、时长）

3、能不能间接服务于平台的经营业绩增长

一方面可以看数据：是否使这些人成为腰部主播（数据表现是否更好），或者看这些人数据（场观、互动、用户停留时长）趋于稳定的周期是否更短或是表现更好4、另一方面直接发问卷问他们对功能的感知程度、使用情况、认可度