数据分析技术面试常问知识点整理

SQL高频面试题

行列转换可以通过CASE WHENGROUP BY实现,适用于统计不同维度的汇总结果。例如:

sql 复制代码
SELECT
  user_id,
  MAX(CASE WHEN type = 'click' THEN cnt ELSE 0 END) AS click_cnt,
  MAX(CASE WHEN type = 'pay' THEN cnt ELSE 0 END) AS pay_cnt
FROM user_action
GROUP BY user_id;

分组取TopN通常使用窗口函数ROW_NUMBER()RANK()实现:

sql 复制代码
SELECT * FROM (
  SELECT
    category,
    sales,
    ROW_NUMBER() OVER (PARTITION BY category ORDER BY sales DESC) AS rn
  FROM product_sales
) t
WHERE rn <= 3;

连续登录或连续日期问题可以通过日期偏移和分组标记法解决:

sql 复制代码
SELECT user_id, COUNT(*) AS continuous_days FROM (
  SELECT
    user_id,
    login_date,
    DATE_SUB(login_date, INTERVAL ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY login_date) DAY) AS flag
  FROM user_login
) t
GROUP BY user_id, flag
HAVING continuous_days >= 3;

去重与统计可以使用COUNT(DISTINCT)GROUP BY

sql 复制代码
SELECT COUNT(DISTINCT user_id) AS uv FROM user_log WHERE date = '2025-12-25';

多表连接与子查询包括INNER JOINLEFT JOIN的使用场景:

sql 复制代码
SELECT u.user_id, u.name, o.order_amount
FROM user u
LEFT JOIN `order` o ON u.user_id = o.user_id;

核心指标理解

基础业务指标包括UV、PV、转化率、留存率、复购率、GMV、客单价和LTV。

留存计算分为次日留存、7日留存和30日留存,公式为:

复制代码
次日留存 = 当日新增用户且次日仍活跃用户数 / 当日新增用户数

转化率包括点击转化率和支付转化率:

复制代码
点击转化率 = 点击用户数 / 曝光用户数
支付转化率 = 支付用户数 / 点击用户数

业务分析思路

数据波动分析框架包括确认数据真实性、拆分维度、对比同期和环比,并结合运营动作分析原因。

漏斗分析适用于转化路径优化,定位流失最大环节并给出优化方向。

用户分层可以通过RFM模型实现,用于精细化运营。


Python与工具相关

Pandas常用操作包括数据读取、缺失值处理、分组聚合和透视表:

python 复制代码
import pandas as pd
df = pd.read_csv('data.csv')
df = df.dropna()
df.groupby('category')['sales'].sum()

数据可视化工具如Matplotlib和Seaborn可用于绘制折线图、柱状图、饼图和热力图。

统计学基础包括均值、中位数、标准差、正态分布和假设检验。


相关推荐
hboot3 天前
AI工程师第二课 - 数据处理
人工智能·python·数据分析
王小王-1235 天前
基于 Hive 的网易云音乐数据分析及可视化系统
hive·hadoop·数据分析·音乐数据分析·网易云音乐分析·hive音乐分析·hadoop网易云
Database_Cool_5 天前
大规模数据分析降本指南:AnalyticDB Serverless 弹性架构实战
数据仓库·阿里云·架构·数据分析·serverless
YangYang9YangYan5 天前
2026初入职场学习数据分析的价值
学习·数据挖掘·数据分析
有Li5 天前
PTCMIL:基于提示 token 聚类的全切片图像多实例学习分析文献速递/多模态医学影像最新进展
论文阅读·学习·数据挖掘·聚类·文献·医学生
数睿数据无代码开发5 天前
打破数据孤岛:深度解析 smardaten 数据连接器核心功能
数据挖掘·无代码
砚底藏山河5 天前
沪深A股:如何获取基金持股数据
java·python·数据分析·maven
jarreyer5 天前
【数据分析绘图】excel绘图和bi工具区别
数据挖掘·数据分析·excel
装不满的克莱因瓶5 天前
了解多标签图像分类方法——从Sigmoid输出到真实世界复杂视觉理解
人工智能·pytorch·python·深度学习·机器学习·分类·数据挖掘