Python使用pandas库,其中的DataFrame可以看作是一个二维的、大小可变的、有潜在异构类型列的表格型数据结构

Python的pandas库是一个非常强大的数据处理工具,其中的DataFrame对象更是其核心组件。DataFrame可以看作是一个二维的、大小可变的、有潜在异构类型列的表格型数据结构。你可以把它想象成一个Excel表格,有行有列,可以存储各种类型的数据。

下面是一些常见的pandas DataFrame对象处理操作:

  1. 创建DataFrame

python

复制

import pandas as pd

使用字典创建DataFrame

data = {'Name': 'Tom', 'Nick', 'John', 'Age': 20, 21, 19}

df = pd.DataFrame(data)

打印DataFrame

print(df)

  1. 查看DataFrame的基本信息

python

复制

查看前几行数据

print(df.head())

查看后几行数据

print(df.tail())

查看数据的基本信息,包括每列的非空值数量、类型等

print(df.info())

查看数据的摘要统计

print(df.describe())

  1. 选择数据

python

复制

选择单列

print(df'Name')

选择多列

print(df\['Name', 'Age'])

使用iloc根据整数位置选择行和列

print(df.iloc0:2, 0:1) # 选择前两行,第一列

使用loc根据标签选择行和列

print(df.loc0:2, 'Name') # 选择前两行,'Name'列

  1. 数据清洗

python

复制

删除含有缺失值的行

df_dropna = df.dropna()

填充缺失值

df_fillna = df.fillna(method='ffill') # 前向填充

  1. 数据排序

python

复制

按照某列进行排序

df_sorted = df.sort_values(by='Age')

  1. 数据分组和聚合

python

复制

按照某列进行分组,并对另一列进行聚合操作(如求和)

df_grouped = df.groupby('Name')'Age'.sum()

  1. 数据合并

python

复制

创建另一个DataFrame

df2 = pd.DataFrame({'Name': 'Tom', 'Jerry', 'Score': 90, 85})

按照'Name'列进行合并

df_merged = pd.merge(df, df2, on='Name')

这些只是pandas DataFrame对象处理的一些基本操作,pandas库的功能远不止于此。如果你需要处理更复杂的数据,建议查阅pandas的官方文档或相关教程。

相关推荐
m沐沐5 分钟前
【深度学习】PyTorch CNN 手写数字识别(卷积神经网络)
人工智能·pytorch·python·深度学习·机器学习·pycharm·cnn
garmin Chen6 分钟前
Prompt工程入门:让AI按你的要求工作(3)--Prompt工程与提示词安全评测概述
java·人工智能·python·安全·prompt
nanawinona9 分钟前
只会用 K 线算期货信号下一步怎么接到交易
python·区块链
叫我:松哥18 分钟前
基于卷积神经网络的静态手势语识别算法,在测试集上的识别准确率达到97.5%
人工智能·python·深度学习·神经网络·算法·cnn
不考研当牛马20 分钟前
Django 框架 深度学习 第二课程
后端·python·django
Dust-Chasing27 分钟前
Claude Code源码剖析 - ShellTool与真实动作
人工智能·python·ai
仙俊红36 分钟前
Java JUC:CompletableFuture 详解,多个任务并行执行并等待全部完成
java·python·spring
学习3人组39 分钟前
Python 评论朴素贝叶斯文本情感分析示例
人工智能·python·机器学习
用户3379225456843 分钟前
A2A Python SDK 源码架构解读:一个请求是如何被处理的
python
2401_8856651943 分钟前
从零搭建卷积神经网络:基于PyTorch实现MNIST手写数字分类
pytorch·python·神经网络·算法·机器学习·分类·cnn