数据清洗-电商双11美妆数据分析

1.数据读取(前八行)

2.数据清洗

2.1 因为数据中存在重复跟空值,将数据进行重复值处理

(删除重复值)

2.2 缺失值处理

存在的缺失值很可能意味着售出的数量为0或者评论的数量为0,所以我们用0来填补缺失值

2.3 数据挖掘寻找新的特征

给出各个关键词的分类类别

由title新生成两列类别

2.4 对是否是男性专用进行分析并新增一列

2.5 对每个产品总销量新增销售额这一列

3.数据分析及可视化

3.1 接下来考虑各个类别的销售情况

3.2 接下来用seaborn包给出每个店铺各个大类以及各个小类的销量销售额

3.2 关于性别

相关推荐
临风赏月44 分钟前
Hudi、Iceberg、Delta Lake、Paimon四种数据湖的建表核心语法
大数据
极客数模3 小时前
【浅析赛题,一等奖水平】思路模型数据相关资料!2025 年“大湾区杯”粤港澳金融数学建模竞赛B 题 稳定币的综合评价与发展分析~
大数据·算法·数学建模·金融·数据挖掘·图论·1024程序员节
临风赏月3 小时前
Hudi、Iceberg、Delta Lake、Paimon 建表语法与场景示例
大数据
luoganttcc4 小时前
加快高水平科技自立自强,引领发展新质生产力 <十五五 规划节选>
大数据·人工智能·科技
TDengine (老段)4 小时前
益和热力性能优化实践:从 SQL Server 到 TDengine 时序数据库,写入快 20 秒、查询提速 5 倍
大数据·数据库·物联网·性能优化·时序数据库·tdengine·1024程序员节
秋已杰爱5 小时前
技术准备十五:Elasticsearch
大数据·elasticsearch·搜索引擎
青云交5 小时前
Java 大视界 -- Java 大数据在智能家居能源消耗模式分析与节能策略制定中的应用
java·大数据·智能家居·数据采集·能源消耗模式分析·节能策略制定·节能效果评估
B站计算机毕业设计之家6 小时前
python图像识别系统 AI多功能图像识别检测系统(11种识别功能)银行卡、植物、动物、通用票据、营业执照、身份证、车牌号、驾驶证、行驶证、车型、Logo✅
大数据·开发语言·人工智能·python·图像识别·1024程序员节·识别
数字化脑洞实验室10 小时前
如何理解不同行业AI决策系统的功能差异?
大数据·人工智能·算法
starandsea15 小时前
gitlab解决传过大文件后删除导致pack过大问题
大数据·elasticsearch·gitlab