数据分析面试题1

1.右表为一组数据,尝试进行简单分析,并给出结论(使用公式和图表辅助)

①理解数据

  • userid:用户id
  • 神兽印记消耗数量

②数据清洗

  • 冻结首行,将列标题的英文字段转换成汉字字段
  • 检查是否有重复项:对用户id这一列进行重复值突出显示,筛选用户id重复项,发现用户id没有重复值,故该数据表无重复值,无需删除
  • 查找缺失值:通过对各单元格计数(count),发现每列单元格数目相同,无缺失值,不做处理
  • 处理异常值:通过筛选器观察数据,并未发现异常值

③描述统计分析

计算四分位数结果如下(max,quartile,median,min)

对数据进行分组统计(countif)

可见神兽印记消耗数量有99%以上都分布在1~400之间的范围

对1~400这个范围进行更细粒度的计算得出

有95%左右的数据集中在1~50之间,可见大部分玩家等级都很低

2.右表为一组数据,尝试进行简单分析,并给出结论(使用数据透视表)

查找缺失值:定位空格→右键删除整行

产品id号为10usd,100usd,15usd,5usd的充值金额为前四,其中10usd是最多的

产品id号为10usd,100usd,15usd,5usd获得金币为前四,其中10usd是最多的

将充值金额与获得金币的数据绘制在同一张折线图上,可以发现两者完全重合,与绘制的额外赠送金币透视表结论相符

对数据透视表导入充值时间数据,并按照年月日进行分组,发现数据全是2021年7月14日的

由图可以看出,4时~15时数据较为平稳,23时是另一个低谷

绘制充值渠道与充值金额的数据透视表,可以看出,渠道11111和11112几乎占据了全部金额,渠道11123几乎没有

3.逻辑思维题,请给出自己的分析:提高《War and Magic》这款游戏LTV的方法有哪些?

定义

  • 用户生命周期价值,它表示对于一款产品,它的平均单个用户在整个用户生命周期中,将会产生的总价值
  • 某款手机游戏的Life time value(LTV),表示当前如果用户下载了该游戏,在其用户的生命周期内预计会产生的价值,它是所有用户产生价值的平均

作用

  • 计算投入产出:ROI=LTV/CP*,LTV作代表收入,广告投入CP*(CPM、CPC、CPD、CPA等)代表成本
  • 优化广告投放配置:计算各个渠道导入用户的LTV、CP*、ROI数据,从而筛选优质渠道优化投放,不断提升边际效益数据

影响因素

  • 广告渗透率(DEU/DAU):即产生广告展示的用户数占活跃用户总数的占比
  • 人均广告展示次数(展示/DAU):人均广告展示次数即平均每个用户观看广告的次数,计算公式为:广告展示数 / 活跃用户数。一般而言,人均广告展示次数越多,LTV越高。但需要注意的是:人均广告展示次数和LTV的关系不是简单的线性关系,人均展示越多,但广告转化一般不会等比例地增加
  • eCPM值:eCPM即千次展示有效收益,指的是每一千次展示可以获得的广告收入。eCPM作为衡量广告变现效果的有效指标已经得到全球主流移动广告平台的肯定。变现效果越好,eCPM越高,则用户LTV越高
  • 用户留存率:用户开始使用游戏并经过一段时间仍然活跃,此类用户就被认作是留存用户。用户留存时间越长,留存用户数越多,越有机会为游戏创造更多的收益价值

方法

  • 追踪用户留存指标:找出那些长期留存率高的用户群体,并找出他们来自于哪些用户获取广告。一旦发现了那些能够提供高价值用户的用户获取广告,便能够优化它们,甚至重新分配你的整体预算去扩大它们的覆盖面
  • 优化长期用户粘性:一旦对用户进行细分,就可以查看他们在手机游戏中的表现,并从营销活动中寻找类似的新用户模式。这将有助于找到潜在的VIP用户,如果能够谨慎地接触这些用户,便能够提高你的手机游戏的LTV
  • 提前计划:为高级用户创建丰富有趣的内容
  • 改进ASO 以实现有效成长:当用户看到付费活动和App Store页面之间的联系时,整体安装量就会增加
  • 明智的细分奖励广告:通常,对于那些在FTUE(首次用户体验)中参与了奖励视频广告的用户来说,他们在IAP(应用内购买)上消费的几率是前者的5倍
  • 针对性和个性化的优惠:每个用户群体对每种虚拟产品的付费意愿各不相同。在手机游戏中,当提供更多数量的产品时,IAP(应用内购买)的价格就应该有内在的折扣
  • 不要忘记病毒性和共享性:与符合用户价值观和风格的热门网红合作;与您的受众相关联的令人兴奋的广告系列;制作跨平台的广告系列
相关推荐
小飞悟1 小时前
你以为 React 的事件很简单?错了,它暗藏玄机!
前端·javascript·面试
涤生大数据2 小时前
Apache Spark 4.0:将大数据分析提升到新的水平
数据分析·spark·apache·数据开发
可观测性用观测云2 小时前
Pipeline 引用外部数据源最佳实践
数据分析
掘金安东尼3 小时前
技术解析:高级 Excel 财务报表解析器的架构与实现
前端·javascript·面试
天天扭码3 小时前
AI时代,前端如何处理大模型返回的多模态数据?
前端·人工智能·面试
阳火锅3 小时前
都2025年了,来看看前端如何给刘亦菲加个水印吧!
前端·vue.js·面试
Java技术小馆4 小时前
GitDiagram如何让你的GitHub项目可视化
java·后端·面试
UGOTNOSHOT4 小时前
7.4项目一问题准备
面试
YaHuiLiang6 小时前
小微互联网公司与互联网创业公司 -- 学历之殇
前端·后端·面试
大数据CLUB8 小时前
基于spark的奥运会奖牌变化数据分析
大数据·hadoop·数据分析·spark