1.什么是数据分析?
观测,实验,应用
观测:数据建设,即打基础,比如搭建数据库和BI平台,保证数据被很好地收集、管理和使用;
实验:数据分析,即从数据中提炼信息、发现规律、验证假设,为决策提供依据;
应用:业务执行,即根据这些洞察实际开展业务,把决策落实到行动中。
2.数据是如何产生的?
a.系统自动记录:计算机程序运行自动生成的日志文件、数据库操作记录等;
b.人为自动生成:用户在社交媒体发布内容、填写问卷、上传文件等;
c.物理感知采集:物联网设备(如摄像头、传感器、检测器等)。
3.什么是数据可视化?
将抽象的数据转化为可感知的图形形式。
4.如何发现数据异常?
a.阈值法:根据业务经验来判断异常,通常有固定阈值和同环比阈值法;
b.统计法:无明确业务规则时,可用正态分布或箱线图的统计方法识别是否存在异常;
c.预测法:一般通过时间序列对实际值进行预测,并得到其置信区间,当超出区间时,则认为是异常波动。
5.如何进行A/B测试?
A/B测试是一种控制变量下的分类讨论,实验逻辑即哪个版本数据好就用哪个版本,是一种基础的分析方法。