数据分析题面试题系列2

一.如何估算星巴克一天的营业额

a.需求澄清:区域?节假日?产品范围?

b.收入=销售杯数*单价=(营业时间*每小时产能*每小时产能利用率)*平均单价

Hypo该星巴克门店的营业时间为12小时(取整),忙时4h,闲时8h,制作一杯饮料时长3min,一小时最大生产量60/3*2=40杯(两台机器)

③Calculation(数据计算):

平均单价=20元*10%+35元*80%+40元*10%≈34元

高峰销售总额=4h*40杯*100%(转换率)*34=5440元

低峰销售总额=8h*40杯*80%(转换率)*34=8704元

合计=高峰销售总额+低峰销售总额=14144元

二.

总结是分功能和内容两方面阐述

产品近期新老用户流失率均较高,你觉得可能是什么原因?数据侧又可以做哪些事情?

考虑因素有哪些:季节、地域、ui、单价、信息、用户习惯改变

3、比较两种方案哪个好:以到底是买一送一好还是五折好的案例为标准

1.确立业务机制、分析对象、业务目标、分析目标

2.确立好可量化的短期和长期目标

3.将指标量化成两个方案可比较的公式

4.分析出影响因素(价格、时长)可以分新老用户考虑

5.总结影响因素和比较指标之间的关系(比如新用户越多,价格越低,活动越有吸引力)

6.考虑实践,分类讨论给结论,可以做AB测试,分可以按不同客群给策略和不可以按不同客群给策略来做(注意两种尽量都做一遍,方便复盘)

3、

针对简历中提到的指标异常分析,你是如何定义指标异常的?

🔻 回答思路参考:

结合我过往经历,我认为指标异常整体分为三大部分,即明确异常定义、异常识别做法、异常处理方式:

首先,明确异常定义,建立标准后才能判断指标是否异常,一共分为2个步骤:

调研现状,了解基线,常用的方式有:

分析业务历史数据来了解指标的正常范围;

参考行业标准或竞争对手的数据作为基线。

设定阈值,建立标准,常用的方式有:

统计方法:使用统计方法(如平均值、标准差、四分位数范围)来设定正常值的范围。

人工规则:例如根据业务逻辑、经验、kpi等来设定阈值。

⚠️注意点:

这里同时需要by简历经历背景,谈观点和实际做法,如果仅是如上描述,就是八股文背诵,缺乏可信度和区分度。

其次,异常识别方法,有了标准后可以根据现状做监控和判断,常用的方法有3类:

图示法:例如

箱线图:通过箱线图可视化数据分布,超出箱型图"胡须"的点通常被认为是异常值。

散点图:在变量之间绘制散点图,观察是否有远离大多数点的离群点。

描述性统计方法:例如

3sigma原则:结合历史数据计算指标的均值方差,构建3sigma区间

四分位数和IQR:使用四分位数范围(IQR)来定义正常值的范围,通常认为低于Q1-1.5IQR或高于Q3+1.5IQR的点是异常。

基于距离/密度/聚类判断法:常见有k-最近邻、LOF、DBSCAN、孤立森林。

⚠️注意点:

这里同时需要结合具体经历做细节过程做法的展开,提高经历的区分度。

最后,异常处理方式,也就是识别指标异常后,要做进一步归因分析+论证、以及经验沉淀,这里:

针对归因分析,主要分为2个部分:

找根因:主要是结合指标构成+业务可落地方向做维度下钻,计算贡献度找根因,例如:xxx...⚠️注意:这里可以结合简历中实际经历信息,做具体分析思路过程的展开。

验效果:针对上述找到的问题,严谨且完整的分析需要进一步确认异常是否由因素变化引起,如果策略有调整异常是否恢复等等

针对沉淀部分,主要是为了提高后续监控和归因效率,主要分为2方面:

是否有必要归纳到自动化工具做监控、产出根因报告,方便业务能够及时根据异常情况调整业务策略。

以及,针对异常出现的严重性,评估异常对业务的影响程度。对于非常重要的指标,可以进一步考虑利用模型提前预测,尤其针对时序数据,可以做异常判别模型,达到提前报警介入的目的

4.你觉得小红书产品有什么可以优化的地方

a.聊使用感受

b不要按个人感受去提改进建议,因为可能商业模式不是你理解的那样,这就需要提前去检索它的商业模式(搞清规模体量、用户特征、发展阶段、竞争格局、竞对的优劣势、当下业务策略以及方向)

c重点说这个岗位方向的优化点

d类似过往经历补充

5.业务要上线新主播首次开播的教学引导,如何评估效果

步骤:定义问题-数据模型-汇报可视化

1、教学功能是否得到使用(曝光率、观看进度、市场)

2、看完之后效果怎么样,直接效果:有多少人成功开播/教学内容应用情况(使用率、频次、时长)

3、能不能间接服务于平台的经营业绩增长

一方面可以看数据:是否使这些人成为腰部主播(数据表现是否更好),或者看这些人数据(场观、互动、用户停留时长)趋于稳定的周期是否更短或是表现更好4、另一方面直接发问卷问他们对功能的感知程度、使用情况、认可度

相关推荐
白水先森4 小时前
如何使用ArcGIS Pro高效查找小区最近的地铁站
经验分享·arcgis·信息可视化·数据分析
Nicole Potter4 小时前
请说明C#中的List是如何扩容的?
开发语言·面试·c#
拉不动的猪7 小时前
刷刷题16
前端·javascript·面试
支撑前端荣耀7 小时前
基于 Vue 的响应式瀑布流实现全景解析
前端·javascript·面试
yuanbenshidiaos7 小时前
【数据挖掘】数据仓库
数据仓库·笔记·数据挖掘
哑巴语天雨7 小时前
前端面试-网络协议篇
websocket·网络协议·http·面试·https
01_8 小时前
力扣hot100——LRU缓存(面试高频考题)
leetcode·缓存·面试·lru
小天努力学java9 小时前
【面试系列】Java开发--AI常见面试题
java·人工智能·面试
lcw_lance9 小时前
人工智能(AI)的不同维度分类
人工智能·分类·数据挖掘
一个 00 后的码农11 小时前
25林业研究生复试面试问题汇总 林业专业知识问题很全! 林业复试全流程攻略 林业考研复试真题汇总
考研·面试·面试问题·考研复试·考研调剂·面试真题·林业考研