Python使用pandas库,其中的DataFrame可以看作是一个二维的、大小可变的、有潜在异构类型列的表格型数据结构

Python的pandas库是一个非常强大的数据处理工具,其中的DataFrame对象更是其核心组件。DataFrame可以看作是一个二维的、大小可变的、有潜在异构类型列的表格型数据结构。你可以把它想象成一个Excel表格,有行有列,可以存储各种类型的数据。

下面是一些常见的pandas DataFrame对象处理操作:

  1. 创建DataFrame

python

复制

import pandas as pd

使用字典创建DataFrame

data = {'Name': ['Tom', 'Nick', 'John'], 'Age': [20, 21, 19]}

df = pd.DataFrame(data)

打印DataFrame

print(df)

  1. 查看DataFrame的基本信息

python

复制

查看前几行数据

print(df.head())

查看后几行数据

print(df.tail())

查看数据的基本信息,包括每列的非空值数量、类型等

print(df.info())

查看数据的摘要统计

print(df.describe())

  1. 选择数据

python

复制

选择单列

print(df['Name'])

选择多列

print(df[['Name', 'Age']])

使用iloc根据整数位置选择行和列

print(df.iloc[0:2, 0:1]) # 选择前两行,第一列

使用loc根据标签选择行和列

print(df.loc[0:2, 'Name']) # 选择前两行,'Name'列

  1. 数据清洗

python

复制

删除含有缺失值的行

df_dropna = df.dropna()

填充缺失值

df_fillna = df.fillna(method='ffill') # 前向填充

  1. 数据排序

python

复制

按照某列进行排序

df_sorted = df.sort_values(by='Age')

  1. 数据分组和聚合

python

复制

按照某列进行分组,并对另一列进行聚合操作(如求和)

df_grouped = df.groupby('Name')['Age'].sum()

  1. 数据合并

python

复制

创建另一个DataFrame

df2 = pd.DataFrame({'Name': ['Tom', 'Jerry'], 'Score': [90, 85]})

按照'Name'列进行合并

df_merged = pd.merge(df, df2, on='Name')

这些只是pandas DataFrame对象处理的一些基本操作,pandas库的功能远不止于此。如果你需要处理更复杂的数据,建议查阅pandas的官方文档或相关教程。

相关推荐
2401_841495643 分钟前
【自然语言处理】处理 GBK 编码汉字的算法设计
人工智能·python·自然语言处理·校验·文件读写·gbk编码与解码·批量过滤
俊俊谢11 分钟前
【机器学习】python使用支持向量机解决兵王问题(基于libsvm库)
python·机器学习·支持向量机·svm·libsvm
爱笑的眼睛1114 分钟前
MLflow Tracking API:超越实验记录,构建可复现的机器学习工作流
java·人工智能·python·ai
小白学大数据16 分钟前
Python 爬虫如何分析并模拟 JS 动态请求
开发语言·javascript·爬虫·python
八月ouc16 分钟前
Python实战小游戏(一):基础计算器 和 猜数字
python·小游戏·猜数字·条件判断·基础计算器·控制流
zoujiahui_201820 分钟前
python中模型加速训练accelerate包的用法
开发语言·python
民乐团扒谱机21 分钟前
【微实验】基于Python实现的实时键盘鼠标触控板拾取检测(VS2019,附完整代码)
python·c#·计算机外设
心本无晴.29 分钟前
拣学--基于vue3和django框架实现的辅助考研系统
vue.js·python·mysql·考研·django·dify
Darenm11130 分钟前
关于AI 面试官项目:智选ai 基于 Vue3 + Django + Dify 的全栈开发实战
人工智能·python·django
詹姆斯爱研究Java32 分钟前
基于Django的租房网站的设计与实现
数据库·python·django