数据分析篇001

目录

一、数据是什么?

二、数据能做什么?

三、数据应用四步骤

第一步---搭建数据体系

第二步---积累数据资产

第三步---完成数据分析

第四步---实现数据应用

四、数据的三种性质

变异性

规律性(以正态分布为例)

客观性

五、优秀数据分析师的三特点

特点一---业务理解

特点二---工具使用

特点三---沟通表达

六、数据分析的九大步骤

步骤一:数据抓取---埋点

步骤二:数据抓取---爬虫

步骤三:数据抓取---API​编辑

步骤四:数据抓取---数据清洗

步骤五:数据分析---描述性统计(可视化)

步骤六:数据分析---诊断性分析

步骤七:数据分析---预测性分析

步骤八:数据分析---仿真模拟

步骤九:业务决策

常见的业务决策方向

七、Excel简介及优劣势分析

Excel优势:

Excel劣势:

八、Python简介及优劣势分析

Python优势:

潜在受众和建立数据标签

仿真应用---舒徐额仿真法

书籍介绍

一、数据是什么?

数据:指未经过处理的原始记录。例如:商品数据(SKU,库存,ASIN,价格等)、用户数据(行为数据、属性数据等)......

SKU,简单理解为一个独特的商品

二、数据能做什么?

以一家线下服装店的经营者为例,通过多年的经营已经在微信上积累了诸多用户,这时如何通过数据分析与数字化经营的思维来管理顾客资产,提升经营效率?

三、数据应用四步骤

第一步---搭建数据体系

常见数据体系维度:

性别、年龄、地理位置、行业、购买力、互动频率、最近互动时间

第二步---积累数据资产

数据资产的积累方向:

1、数据维度数量的增加

2、数据维度复杂性的增加

3、单维度数据数量的增加

4、单维度数据判断精准性的增加

当数据资产积累到一定程度时,就需要用单独的数据库存储数据。

第三步---完成数据分析

描述性分析、用户价值分析、用户分类分析

第四步---实现数据应用

常见数据应用方向:

1、个性化推荐

2、价格歧视

3、A/B test

4、用户生命周期管理

5、产品生命周期管理

app"杀熟"

四、数据的三种性质

变异性

规律性(以正态分布为例)

客观性

从多角度分析;

五、优秀数据分析师的三特点

特点一---业务理解

电商业务:GMV、复购率、客单价、流量、转化率、折扣率

广告业务:单次点击竞价、点击率、有效访问率、广告预算

产品业务:PV、UV、日活/月活、用户留存、ARPU

供应链业务:缺货率、安全库存、滞销率、备货量

营销业务:市场占有率、ROI(投资回报率)、头部市场/腰部市场/长尾市场

点击XXX:推荐给用户的要真正有用

访问<点击

日活和月活:app使用活跃度

特点二---工具使用

简单业务,数据处理的价值点很低,可复制性强

复杂业务,精准度和单一创造价值越大
预测:结果单一,易受影响

仿真分析:给出一系列结果,不易被影响

特点三---沟通表达

二八分布:20%的市场可能拥有80%的市场占有率和80%的利润来源

成交>咨询

六、数据分析的九大步骤

步骤一:数据抓取---埋点

埋点:在应用中特定的流程收集一些信息,用来跟踪应用使用的状况,后续用来进一步优化产品或是提供运营的数据支撑。

步骤二:数据抓取---爬虫

爬虫:指的是按照一定规则,自动抓取万维网信息的程序或者脚本。

步骤三:数据抓取---API

api,指的是应用程序接口,他是一些预先定义的函数,可以在无需访问源码的前提下,使应用程序的开发人员基于某软件或者硬件访问的一组例程。

步骤四:数据抓取---数据清洗

数据质量分析

1、缺失值分析(空置/遗漏值)

2、异常值分析(离群点分析)

3、一致性分析(矛盾/多数据源数据)

步骤五:数据分析---描述性统计(可视化)

气泡图,可以同时显示三个维度的数据信息

步骤六:数据分析---诊断性分析

周权重指数=1.09+1.26+1.14+1.27+1.20+1.13+1.00=8.11

边界效应

步骤七:数据分析---预测性分析

步骤八:数据分析---仿真模拟

步骤九:业务决策

常见的业务决策方向

1、描述性统计---用户画像---针对性运营

2、诊断性分析---ROI评估---企业资源配置优化

3、预测性分析---未来业绩评估---活动策划/人员工作排期

4、仿真模拟---不同情况风险评估---供应链资源规划

七、Excel简介及优劣势分析

Excel优势:

1、对单数据源(单表格)数据分析非常灵活,方便

2、操作简单,分析方法可复制性强,对业务放指导性强

Excel劣势:

1、对多数据源(多表格)数据分析时较为麻烦,低效

2、对大数据量数据源分析时容易发生卡顿、报错

八、Python简介及优劣势分析

Python优势:

1、可读性文字编写的语言之一,学习难度较小

2、数据可视化、数据分析的工具包丰富,分析效率高

潜在受众和建立数据标签

仿真应用---舒徐额仿真法

书籍介绍:

相关推荐
阿里云大数据AI技术3 小时前
ODPS 十五周年实录 | 为 AI 而生的数据平台
大数据·数据分析·开源
SelectDB技术团队4 小时前
Apache Doris 在菜鸟的大规模湖仓业务场景落地实践
数据库·数据仓库·数据分析·apache doris·菜鸟技术
一个处女座的程序猿5 小时前
DataAnalytics之Tool:Metabase的简介、安装和使用方法、案例应用之详细攻略
数据分析
星期天要睡觉7 小时前
机器学习深度学习 所需数据的清洗实战案例 (结构清晰、万字解析、完整代码)包括机器学习方法预测缺失值的实践
人工智能·深度学习·机器学习·数据挖掘
山烛9 小时前
矿物分类系统开发笔记(二):模型训练[删除空缺行]
人工智能·笔记·python·机器学习·分类·数据挖掘
Tezign_space12 小时前
特赞内容运营解决方案,AI重构品牌内容价值链
大数据·人工智能·数据挖掘·产品运营·内容运营·内容+ai·agentai
喂完待续1 天前
【Tech Arch】Spark为何成为大数据引擎之王
大数据·hadoop·python·数据分析·spark·apache·mapreduce
源码宝1 天前
【智慧工地源码】智慧工地云平台系统,涵盖安全、质量、环境、人员和设备五大管理模块,实现实时监控、智能预警和数据分析。
java·大数据·spring cloud·数据分析·源码·智慧工地·云平台
SelectDB1 天前
Apache Doris 4.0 AI 能力揭秘(一):AI 函数之 LLM 函数介绍
数据库·人工智能·数据分析
数据超市1 天前
香港数据合集:建筑物、手机基站、POI、职住数据、用地类型
大数据·人工智能·智能手机·数据挖掘·数据分析