Python AI库 Pandas的常见操作的扩展知识

Python AI库 Pandas的常见操作的扩展知识

本文默认读者具备以下技能:

  • 熟悉python基础知识,vscode或其它编辑工具
  • 熟悉表格文件的基本操作
  • 具备自主扩展学习能力

前文中对Pandas的数据结构以及基础操作做了介绍,本文中会在前文的基础上,对常见的操作进行拓展,并举例说明。

一、数据读取与查看

Pandas提供了多种方法读取不同格式的数据文件,例如CSV、Excel等。读取数据后,可以通过简单的函数查看数据的整体情况。

python 复制代码
import pandas as pd

# 读取CSV文件
df = pd.read_csv('data.csv')

# 查看数据的前5行
print(df.head())

# 查看数据的基本信息,包括列名、数据类型、非空值数量等
print(df.info())

扩展信息read_csv函数支持多种参数,如header指定列名所在的行,delimiter指定分隔符等。head函数默认显示前5行,但可以通过传递参数来指定显示的行数。

二、数据筛选

Pandas提供了灵活的条件筛选功能,可以根据条件过滤出满足特定条件的数据行。

python 复制代码
# 筛选年龄大于30的数据行
filtered_df = df[df['age'] > 30]

# 使用逻辑运算符进行复合条件筛选
filtered_df_complex = df[(df['age'] > 30) & (df['gender'] == 'male')]

print(filtered_df_complex)

扩展信息 :除了使用列名和比较运算符进行筛选,Pandas还支持使用isin函数进行多值筛选,以及使用query函数进行更复杂的查询。

三、数据排序

Pandas允许我们根据一列或多列对数据进行排序。

python 复制代码
# 根据年龄列进行升序排序
sorted_df = df.sort_values(by='age', ascending=True)

# 根据多列进行排序,先按年龄升序,再按姓名降序
sorted_df_multi = df.sort_values(by=['age', 'name'], ascending=[True, False])

print(sorted_df_multi)

扩展信息sort_values函数支持ascending参数指定排序方式(升序或降序),默认为升序。同时,也可以通过inplace参数选择是否直接修改原DataFrame。

四、数据分组与聚合

Pandas提供了groupby功能,可以对数据进行分组,并对每个组执行聚合操作。

python 复制代码
# 根据性别列分组,并计算每组的平均年龄
grouped_df = df.groupby('gender')['age'].mean()

# 展示分组后的结果
print(grouped_df)

扩展信息 :除了计算平均值,groupby还可以与许多聚合函数一起使用,如sumcountmaxmin等。同时,还可以使用agg函数执行多个聚合操作。

五、缺失数据处理

Pandas提供了处理缺失数据(NaN)的功能,包括检测、填充和删除等操作。

python 复制代码
# 检测缺失值
print(df.isnull().sum())

# 填充缺失值,例如使用列的平均值填充年龄列的缺失值
df['age'].fillna(df['age'].mean(), inplace=True)

# 删除含有缺失值的行
df_dropna = df.dropna()

print(df_dropna)

扩展信息fillna函数支持多种填充方式,如使用固定值、前一个有效值、后一个有效值等。同时,dropna函数还支持指定轴(行或列)进行删除操作。

相关推荐
Tester_孙大壮19 分钟前
Python爬虫技术科普
开发语言·爬虫·python
AI明说20 分钟前
DDI-GPT:使用知识图谱增强的大模型对药物相互作用进行可解释的预测
人工智能·gpt·大模型·知识图谱·数智药师·数智药学
视觉&物联智能44 分钟前
【杂谈】-AI搜索引擎如何改变传统SEO及其在内容营销中的作用
人工智能·搜索引擎·ai·aigc·seo
九河云1 小时前
Amazon Bedrock Claude 3 在客户服务自动化中的应用方法
运维·人工智能·自动化·aws
文心快码 Baidu Comate1 小时前
打破视障壁垒,百度文心快码无障碍版本助力视障IT从业者就业无“碍”
人工智能·ai编程·文心快码·智能编程助手·智能代码助手
诚威_lol_中大努力中1 小时前
关于pytorch3d的安装
人工智能·pytorch·python
GISer_Jing1 小时前
神经网络、深度学习、卷积神经网络
python
herogus丶1 小时前
【Spring AI】Spring AI Alibaba的简单使用
java·人工智能·spring·ai
onejason1 小时前
深度解析:利用Python爬虫获取亚马逊商品详情
前端·python
小王子10242 小时前
数据结构与算法Python版 二叉查找树
数据结构·python·算法·二叉查找树