数据分析题面试题系列2

一.如何估算星巴克一天的营业额

a.需求澄清:区域?节假日?产品范围?

b.收入=销售杯数*单价=(营业时间*每小时产能*每小时产能利用率)*平均单价

Hypo该星巴克门店的营业时间为12小时(取整),忙时4h,闲时8h,制作一杯饮料时长3min,一小时最大生产量60/3*2=40杯(两台机器)

③Calculation(数据计算):

平均单价=20元*10%+35元*80%+40元*10%≈34元

高峰销售总额=4h*40杯*100%(转换率)*34=5440元

低峰销售总额=8h*40杯*80%(转换率)*34=8704元

合计=高峰销售总额+低峰销售总额=14144元

二.

总结是分功能和内容两方面阐述

产品近期新老用户流失率均较高,你觉得可能是什么原因?数据侧又可以做哪些事情?

考虑因素有哪些:季节、地域、ui、单价、信息、用户习惯改变

3、比较两种方案哪个好:以到底是买一送一好还是五折好的案例为标准

1.确立业务机制、分析对象、业务目标、分析目标

2.确立好可量化的短期和长期目标

3.将指标量化成两个方案可比较的公式

4.分析出影响因素(价格、时长)可以分新老用户考虑

5.总结影响因素和比较指标之间的关系(比如新用户越多,价格越低,活动越有吸引力)

6.考虑实践,分类讨论给结论,可以做AB测试,分可以按不同客群给策略和不可以按不同客群给策略来做(注意两种尽量都做一遍,方便复盘)

3、

针对简历中提到的指标异常分析,你是如何定义指标异常的?

🔻 回答思路参考:

结合我过往经历,我认为指标异常整体分为三大部分,即明确异常定义、异常识别做法、异常处理方式:

首先,明确异常定义,建立标准后才能判断指标是否异常,一共分为2个步骤:

调研现状,了解基线,常用的方式有:

分析业务历史数据来了解指标的正常范围;

参考行业标准或竞争对手的数据作为基线。

设定阈值,建立标准,常用的方式有:

统计方法:使用统计方法(如平均值、标准差、四分位数范围)来设定正常值的范围。

人工规则:例如根据业务逻辑、经验、kpi等来设定阈值。

⚠️注意点:

这里同时需要by简历经历背景,谈观点和实际做法,如果仅是如上描述,就是八股文背诵,缺乏可信度和区分度。

其次,异常识别方法,有了标准后可以根据现状做监控和判断,常用的方法有3类:

图示法:例如

箱线图:通过箱线图可视化数据分布,超出箱型图"胡须"的点通常被认为是异常值。

散点图:在变量之间绘制散点图,观察是否有远离大多数点的离群点。

描述性统计方法:例如

3sigma原则:结合历史数据计算指标的均值方差,构建3sigma区间

四分位数和IQR:使用四分位数范围(IQR)来定义正常值的范围,通常认为低于Q1-1.5IQR或高于Q3+1.5IQR的点是异常。

基于距离/密度/聚类判断法:常见有k-最近邻、LOF、DBSCAN、孤立森林。

⚠️注意点:

这里同时需要结合具体经历做细节过程做法的展开,提高经历的区分度。

最后,异常处理方式,也就是识别指标异常后,要做进一步归因分析+论证、以及经验沉淀,这里:

针对归因分析,主要分为2个部分:

找根因:主要是结合指标构成+业务可落地方向做维度下钻,计算贡献度找根因,例如:xxx...⚠️注意:这里可以结合简历中实际经历信息,做具体分析思路过程的展开。

验效果:针对上述找到的问题,严谨且完整的分析需要进一步确认异常是否由因素变化引起,如果策略有调整异常是否恢复等等

针对沉淀部分,主要是为了提高后续监控和归因效率,主要分为2方面:

是否有必要归纳到自动化工具做监控、产出根因报告,方便业务能够及时根据异常情况调整业务策略。

以及,针对异常出现的严重性,评估异常对业务的影响程度。对于非常重要的指标,可以进一步考虑利用模型提前预测,尤其针对时序数据,可以做异常判别模型,达到提前报警介入的目的

4.你觉得小红书产品有什么可以优化的地方

a.聊使用感受

b不要按个人感受去提改进建议,因为可能商业模式不是你理解的那样,这就需要提前去检索它的商业模式(搞清规模体量、用户特征、发展阶段、竞争格局、竞对的优劣势、当下业务策略以及方向)

c重点说这个岗位方向的优化点

d类似过往经历补充

5.业务要上线新主播首次开播的教学引导,如何评估效果

步骤:定义问题-数据模型-汇报可视化

1、教学功能是否得到使用(曝光率、观看进度、市场)

2、看完之后效果怎么样,直接效果:有多少人成功开播/教学内容应用情况(使用率、频次、时长)

3、能不能间接服务于平台的经营业绩增长

一方面可以看数据:是否使这些人成为腰部主播(数据表现是否更好),或者看这些人数据(场观、互动、用户停留时长)趋于稳定的周期是否更短或是表现更好4、另一方面直接发问卷问他们对功能的感知程度、使用情况、认可度

相关推荐
请你喝好果汁6411 小时前
单细胞|M3-4. 细胞聚类与轨迹推断
机器学习·数据挖掘·聚类
吾门1 小时前
YOLO入门教程(三)——训练自己YOLO11实例分割模型并预测【含教程源码+一键分类数据集 + 故障排查】
yolo·分类·数据挖掘
J老熊2 小时前
JavaFX:简介、使用场景、常见问题及对比其他框架分析
java·开发语言·后端·面试·系统架构·软件工程
猿java2 小时前
什么是 Hystrix?它的工作原理是什么?
java·微服务·面试
电子手信3 小时前
知识中台在多语言客户中的应用
大数据·人工智能·自然语言处理·数据挖掘·知识图谱
databook3 小时前
『玩转Streamlit』--布局与容器组件
python·机器学习·数据分析
shansjqun3 小时前
教学内容全覆盖:航拍杂草检测与分类
人工智能·分类·数据挖掘
SelectDB技术团队4 小时前
兼顾高性能与低成本,浅析 Apache Doris 异步物化视图原理及典型场景
大数据·数据库·数据仓库·数据分析·doris
陪学4 小时前
百度遭初创企业指控抄袭,维权还是碰瓷?
人工智能·百度·面试·职场和发展·产品运营
panpantt3215 小时前
【参会邀请】第二届大数据与数据挖掘国际会议(BDDM 2024)邀您相聚江城!
大数据·人工智能·数据挖掘