数据清洗-电商双11美妆数据分析

1.数据读取(前八行)

2.数据清洗

2.1 因为数据中存在重复跟空值,将数据进行重复值处理

(删除重复值)

2.2 缺失值处理

存在的缺失值很可能意味着售出的数量为0或者评论的数量为0,所以我们用0来填补缺失值

2.3 数据挖掘寻找新的特征

给出各个关键词的分类类别

由title新生成两列类别

2.4 对是否是男性专用进行分析并新增一列

2.5 对每个产品总销量新增销售额这一列

3.数据分析及可视化

3.1 接下来考虑各个类别的销售情况

3.2 接下来用seaborn包给出每个店铺各个大类以及各个小类的销量销售额

3.2 关于性别

相关推荐
大大大大晴天3 小时前
Hudi技术内幕:RecordPayload到RecordMerger
大数据
SelectDB18 小时前
秒级弹性、最高降本 70%:SelectDB Serverless 如何重塑云数仓资源效率
大数据·后端·云原生
WhoAmI18 小时前
MapReduce框架原理解析一:InputFormat
大数据·hadoop
WhoAmI18 小时前
MapReduce框架原理解析三:OutputFormat
大数据·hadoop
WhoAmI19 小时前
MapReduce框架原理解析二:Shuffle
大数据·hadoop
大大大大晴天2 天前
Hudi技术内幕:Key Generation原理与实践
大数据
得物技术5 天前
从埋点需求到规则资产:Hermes Agent 重构得物数仓工作流
大数据·llm·ai编程
久美子5 天前
AI驱动数仓建设的Harness工程实践——本体建模、知识分层与上下文工程
大数据
大树886 天前
金刚石散热越强,管路越先见顶
大数据·运维·服务器·人工智能·ai
大志哥1236 天前
ES和Logstash日志链路系统上线后遭遇切片爆炸(解决)
大数据·elasticsearch