数据分析技术面试常问知识点整理

SQL高频面试题

行列转换可以通过CASE WHENGROUP BY实现,适用于统计不同维度的汇总结果。例如:

sql 复制代码
SELECT
  user_id,
  MAX(CASE WHEN type = 'click' THEN cnt ELSE 0 END) AS click_cnt,
  MAX(CASE WHEN type = 'pay' THEN cnt ELSE 0 END) AS pay_cnt
FROM user_action
GROUP BY user_id;

分组取TopN通常使用窗口函数ROW_NUMBER()RANK()实现:

sql 复制代码
SELECT * FROM (
  SELECT
    category,
    sales,
    ROW_NUMBER() OVER (PARTITION BY category ORDER BY sales DESC) AS rn
  FROM product_sales
) t
WHERE rn <= 3;

连续登录或连续日期问题可以通过日期偏移和分组标记法解决:

sql 复制代码
SELECT user_id, COUNT(*) AS continuous_days FROM (
  SELECT
    user_id,
    login_date,
    DATE_SUB(login_date, INTERVAL ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY login_date) DAY) AS flag
  FROM user_login
) t
GROUP BY user_id, flag
HAVING continuous_days >= 3;

去重与统计可以使用COUNT(DISTINCT)GROUP BY

sql 复制代码
SELECT COUNT(DISTINCT user_id) AS uv FROM user_log WHERE date = '2025-12-25';

多表连接与子查询包括INNER JOINLEFT JOIN的使用场景:

sql 复制代码
SELECT u.user_id, u.name, o.order_amount
FROM user u
LEFT JOIN `order` o ON u.user_id = o.user_id;

核心指标理解

基础业务指标包括UV、PV、转化率、留存率、复购率、GMV、客单价和LTV。

留存计算分为次日留存、7日留存和30日留存,公式为:

复制代码
次日留存 = 当日新增用户且次日仍活跃用户数 / 当日新增用户数

转化率包括点击转化率和支付转化率:

复制代码
点击转化率 = 点击用户数 / 曝光用户数
支付转化率 = 支付用户数 / 点击用户数

业务分析思路

数据波动分析框架包括确认数据真实性、拆分维度、对比同期和环比,并结合运营动作分析原因。

漏斗分析适用于转化路径优化,定位流失最大环节并给出优化方向。

用户分层可以通过RFM模型实现,用于精细化运营。


Python与工具相关

Pandas常用操作包括数据读取、缺失值处理、分组聚合和透视表:

python 复制代码
import pandas as pd
df = pd.read_csv('data.csv')
df = df.dropna()
df.groupby('category')['sales'].sum()

数据可视化工具如Matplotlib和Seaborn可用于绘制折线图、柱状图、饼图和热力图。

统计学基础包括均值、中位数、标准差、正态分布和假设检验。


相关推荐
FL162386312912 小时前
窗户干净脏污分类窗户清洁状态分类数据集3299张2类别已划分训练验证测试集
人工智能·分类·数据挖掘
Quincy_Freak12 小时前
银河麒麟aarch64如何高效做数据分析?分享一款内网离线数据分析利器
大数据·数据库·数据挖掘·数据分析·aarch64
Aloudata18 小时前
AI 黑盒生成 vs 原子语义组合:企业指标生产路径深度对比
大数据·人工智能·数据分析·指标平台·语义层
Quincy_Freak18 小时前
工具分享|基于 SQLiteGo 的国产系统离线数据处理方案
大数据·数据库·数据分析·arm·国产系统·银河麒麟·aarch64
计算机安禾19 小时前
【算法分析与设计】第21篇:回溯法的状态空间树与剪枝函数设计
大数据·人工智能·算法·机器学习·数据挖掘·剪枝
wayz1119 小时前
Momentum:BRAR(人气意愿指标)技术指标详解
金融·数据分析·量化交易·特征工程
wayz1119 小时前
20260530 软件ETF(159852)量化分析
算法·金融·数据分析·量化交易
久违 °1 天前
【AI-Agent】TagMatrix 数据标注工具开发
人工智能·数据分析·go·agent·数据隐私
城数派2 天前
2026年500米分辨率DEM地形数据(全球/全国/分省/分市)
数据库·arcgis·信息可视化·数据分析·excel
DisonTangor2 天前
跃阶星辰开源Step 3.7 Flash:原生多模态,最高生成速度400 Tokens/s
人工智能·语言模型·数据挖掘·开源·aigc