Python使用pandas库,其中的DataFrame可以看作是一个二维的、大小可变的、有潜在异构类型列的表格型数据结构

Python的pandas库是一个非常强大的数据处理工具,其中的DataFrame对象更是其核心组件。DataFrame可以看作是一个二维的、大小可变的、有潜在异构类型列的表格型数据结构。你可以把它想象成一个Excel表格,有行有列,可以存储各种类型的数据。

下面是一些常见的pandas DataFrame对象处理操作:

  1. 创建DataFrame

python

复制

import pandas as pd

使用字典创建DataFrame

data = {'Name': ['Tom', 'Nick', 'John'], 'Age': [20, 21, 19]}

df = pd.DataFrame(data)

打印DataFrame

print(df)

  1. 查看DataFrame的基本信息

python

复制

查看前几行数据

print(df.head())

查看后几行数据

print(df.tail())

查看数据的基本信息,包括每列的非空值数量、类型等

print(df.info())

查看数据的摘要统计

print(df.describe())

  1. 选择数据

python

复制

选择单列

print(df['Name'])

选择多列

print(df[['Name', 'Age']])

使用iloc根据整数位置选择行和列

print(df.iloc[0:2, 0:1]) # 选择前两行,第一列

使用loc根据标签选择行和列

print(df.loc[0:2, 'Name']) # 选择前两行,'Name'列

  1. 数据清洗

python

复制

删除含有缺失值的行

df_dropna = df.dropna()

填充缺失值

df_fillna = df.fillna(method='ffill') # 前向填充

  1. 数据排序

python

复制

按照某列进行排序

df_sorted = df.sort_values(by='Age')

  1. 数据分组和聚合

python

复制

按照某列进行分组,并对另一列进行聚合操作(如求和)

df_grouped = df.groupby('Name')['Age'].sum()

  1. 数据合并

python

复制

创建另一个DataFrame

df2 = pd.DataFrame({'Name': ['Tom', 'Jerry'], 'Score': [90, 85]})

按照'Name'列进行合并

df_merged = pd.merge(df, df2, on='Name')

这些只是pandas DataFrame对象处理的一些基本操作,pandas库的功能远不止于此。如果你需要处理更复杂的数据,建议查阅pandas的官方文档或相关教程。

相关推荐
Dxy12393102162 小时前
Python PDFplumber详解:从入门到精通的PDF处理指南
开发语言·python·pdf
在努力的韩小豪4 小时前
如何从0开始构建自己的第一个AI应用?(Prompt工程、Agent自定义、Tuning)
人工智能·python·llm·prompt·agent·ai应用·mcp
Otaku love travel5 小时前
实施运维文档
运维·windows·python
测试老哥5 小时前
软件测试之单元测试
自动化测试·软件测试·python·测试工具·职场和发展·单元测试·测试用例
presenttttt6 小时前
用Python和OpenCV从零搭建一个完整的双目视觉系统(六 最终篇)
开发语言·python·opencv·计算机视觉
测试19987 小时前
软件测试之压力测试总结
自动化测试·软件测试·python·测试工具·职场和发展·测试用例·压力测试
李昊哲小课8 小时前
销售数据可视化分析项目
python·信息可视化·数据分析·matplotlib·数据可视化·seaborn
烛阴8 小时前
带参数的Python装饰器原来这么简单,5分钟彻底掌握!
前端·python
全干engineer8 小时前
Flask 入门教程:用 Python 快速搭建你的第一个 Web 应用
后端·python·flask·web
nightunderblackcat8 小时前
新手向:Python网络编程,搭建简易HTTP服务器
网络·python·http