Python数据分析(空值、重复值检测删除与设置)

打开Anaconda PowerShell

cd 进入指定该文件下,输入jupyter notebook,就能在该目录下打开

python 复制代码
import numpy as np
import pandas as pd
df_obj = pd.DataFrame({"类别":["小说", "散文随笔", "青春文学","传记"],
                   "书名":[np.nan, "《皮囊》", "《旅程结束时》", "《老舍自传》"],
                    "作者":["老舍", None, "张其鑫", "老舍"]})
import pandas as pd
df=pd.read_excel('线上课程-综合测试1-MG公司2019年销售数据试题.xlsx')
df

空值检测

python 复制代码
df['成本'].isnull().value_counts()# 成本这一列是空的True与False数量统计

df['成本'].isnull().any()# 成本这列是否存在空值

重复检测


python 复制代码
df.dropna(subset='收入类别',inplace=True) # subset检查"区域"这列的重复值情况
df
相关推荐
万添裁7 分钟前
pytorch的张量数据结构以及各种操作函数的底层原理
人工智能·pytorch·python
浔川python社18 分钟前
张雪机车:以热爱为轮,让中国摩托驰骋世界之巅
python
zl_dfq24 分钟前
Python学习5 之【字符串】
python·学习
rainy雨31 分钟前
免费且好用的精益工具在哪里?2026年精益工具清单整理
大数据·人工智能·信息可视化·数据挖掘·数据分析·精益工程
ZC跨境爬虫34 分钟前
Python异步IO详解:原理、应用场景与实战指南(高并发爬虫首选)
爬虫·python·算法·自动化
前进的李工40 分钟前
MySQL大小写规则与存储引擎详解
开发语言·数据库·sql·mysql·存储引擎
倦王1 小时前
力扣日刷47-补
python·算法·leetcode
错把套路当深情1 小时前
Java 全方向开发技术栈指南
java·开发语言
前端郭德纲1 小时前
JavaScript Object.freeze() 详解
开发语言·javascript·ecmascript