数据分析题面试题系列2

一.如何估算星巴克一天的营业额

a.需求澄清:区域?节假日?产品范围?

b.收入=销售杯数*单价=(营业时间*每小时产能*每小时产能利用率)*平均单价

Hypo该星巴克门店的营业时间为12小时(取整),忙时4h,闲时8h,制作一杯饮料时长3min,一小时最大生产量60/3*2=40杯(两台机器)

③Calculation(数据计算):

平均单价=20元*10%+35元*80%+40元*10%≈34元

高峰销售总额=4h*40杯*100%(转换率)*34=5440元

低峰销售总额=8h*40杯*80%(转换率)*34=8704元

合计=高峰销售总额+低峰销售总额=14144元

二.

总结是分功能和内容两方面阐述

产品近期新老用户流失率均较高,你觉得可能是什么原因?数据侧又可以做哪些事情?

考虑因素有哪些:季节、地域、ui、单价、信息、用户习惯改变

3、比较两种方案哪个好:以到底是买一送一好还是五折好的案例为标准

1.确立业务机制、分析对象、业务目标、分析目标

2.确立好可量化的短期和长期目标

3.将指标量化成两个方案可比较的公式

4.分析出影响因素(价格、时长)可以分新老用户考虑

5.总结影响因素和比较指标之间的关系(比如新用户越多,价格越低,活动越有吸引力)

6.考虑实践,分类讨论给结论,可以做AB测试,分可以按不同客群给策略和不可以按不同客群给策略来做(注意两种尽量都做一遍,方便复盘)

3、

针对简历中提到的指标异常分析,你是如何定义指标异常的?

🔻 回答思路参考:

结合我过往经历,我认为指标异常整体分为三大部分,即明确异常定义、异常识别做法、异常处理方式:

首先,明确异常定义,建立标准后才能判断指标是否异常,一共分为2个步骤:

调研现状,了解基线,常用的方式有:

分析业务历史数据来了解指标的正常范围;

参考行业标准或竞争对手的数据作为基线。

设定阈值,建立标准,常用的方式有:

统计方法:使用统计方法(如平均值、标准差、四分位数范围)来设定正常值的范围。

人工规则:例如根据业务逻辑、经验、kpi等来设定阈值。

⚠️注意点:

这里同时需要by简历经历背景,谈观点和实际做法,如果仅是如上描述,就是八股文背诵,缺乏可信度和区分度。

其次,异常识别方法,有了标准后可以根据现状做监控和判断,常用的方法有3类:

图示法:例如

箱线图:通过箱线图可视化数据分布,超出箱型图"胡须"的点通常被认为是异常值。

散点图:在变量之间绘制散点图,观察是否有远离大多数点的离群点。

描述性统计方法:例如

3sigma原则:结合历史数据计算指标的均值方差,构建3sigma区间

四分位数和IQR:使用四分位数范围(IQR)来定义正常值的范围,通常认为低于Q1-1.5IQR或高于Q3+1.5IQR的点是异常。

基于距离/密度/聚类判断法:常见有k-最近邻、LOF、DBSCAN、孤立森林。

⚠️注意点:

这里同时需要结合具体经历做细节过程做法的展开,提高经历的区分度。

最后,异常处理方式,也就是识别指标异常后,要做进一步归因分析+论证、以及经验沉淀,这里:

针对归因分析,主要分为2个部分:

找根因:主要是结合指标构成+业务可落地方向做维度下钻,计算贡献度找根因,例如:xxx...⚠️注意:这里可以结合简历中实际经历信息,做具体分析思路过程的展开。

验效果:针对上述找到的问题,严谨且完整的分析需要进一步确认异常是否由因素变化引起,如果策略有调整异常是否恢复等等

针对沉淀部分,主要是为了提高后续监控和归因效率,主要分为2方面:

是否有必要归纳到自动化工具做监控、产出根因报告,方便业务能够及时根据异常情况调整业务策略。

以及,针对异常出现的严重性,评估异常对业务的影响程度。对于非常重要的指标,可以进一步考虑利用模型提前预测,尤其针对时序数据,可以做异常判别模型,达到提前报警介入的目的

4.你觉得小红书产品有什么可以优化的地方

a.聊使用感受

b不要按个人感受去提改进建议,因为可能商业模式不是你理解的那样,这就需要提前去检索它的商业模式(搞清规模体量、用户特征、发展阶段、竞争格局、竞对的优劣势、当下业务策略以及方向)

c重点说这个岗位方向的优化点

d类似过往经历补充

5.业务要上线新主播首次开播的教学引导,如何评估效果

步骤:定义问题-数据模型-汇报可视化

1、教学功能是否得到使用(曝光率、观看进度、市场)

2、看完之后效果怎么样,直接效果:有多少人成功开播/教学内容应用情况(使用率、频次、时长)

3、能不能间接服务于平台的经营业绩增长

一方面可以看数据:是否使这些人成为腰部主播(数据表现是否更好),或者看这些人数据(场观、互动、用户停留时长)趋于稳定的周期是否更短或是表现更好4、另一方面直接发问卷问他们对功能的感知程度、使用情况、认可度

相关推荐
菜鸟的人工智能之路1 小时前
ROC 曲线:医学研究中的得力助手
python·数据分析·健康医疗
半夏之沫2 小时前
✨最新金九银十✨大厂后端面经✨
java·后端·面试
旋转的油纸伞4 小时前
大模型,多模态大模型面试【LoRA,分类,动静态数据类型,DDPM,ControlNet,IP-Adapter, Stable Diffusion】
算法·leetcode·面试·职场和发展·散列表
程序员yt5 小时前
2025秋招八股文--服务器篇
linux·运维·服务器·c++·后端·面试
web_code5 小时前
vite依赖预构建(源码分析)
前端·面试·vite
迷路爸爸1805 小时前
深入理解Allan方差:用体重数据分析误差的时间尺度与稳定性
机器学习·数据分析·概率论
秋恬意7 小时前
LinkedList 源码分析
java·开发语言·面试
JSON_L9 小时前
面试题整理1
后端·面试·php
鱼跃鹰飞10 小时前
大厂面试真题-简单描述一下SpringBoot的启动过程
java·spring boot·后端·spring·面试
Pandaconda11 小时前
【计算机网络 - 基础问题】每日 3 题(五十九)
开发语言·经验分享·笔记·后端·计算机网络·面试·职场和发展