Pandas

Pandas 是一个开源的 Python 数据分析库,它提供了高性能的数据结构和数据分析工具。Pandas 最初被设计用于处理表格数据,即类似于 Excel 中的数据表,但它的功能远不止于此。Pandas 特别适合于处理结构化数据,例如金融时间序列数据。

主要特点:

DataFrame:Pandas 的核心数据结构,类似于 Excel 中的表格,可以存储不同类型的列。

Series:一维数组,类似于 Excel 中的一列数据。

时间序列:Pandas 提供了处理时间序列的强大工具。

  1. **数据合并**:可以轻松地合并、连接和重塑数据集。

  2. **数据分组**:可以对数据进行分组,并对每个组应用聚合、转换或过滤操作。

  3. **数据索引**:提供了多种索引方式,包括标签索引、时间索引等。

  4. **数据可视化**:Pandas 可以与 Matplotlib 等可视化库集成,方便地进行数据可视化。

安装 Pandas

pip install pandas

基本使用:

  1. **导入 Pandas**:

import pandas as pd

  1. **创建 DataFrame**:
python 复制代码
# 使用字典创建 DataFrame
data = {'Name': ['John', 'Anna', 'Peter', 'Linda'],
        'Age': [28, 23, 34, 29],
        'City': ['New York', 'Paris', 'Berlin', 'London']}
df = pd.DataFrame(data)
  1. **查看数据**:
python 复制代码
# 查看前5行数据
print(df.head())

# 查看数据框信息
print(df.info())
  1. **数据选择**:
python 复制代码
# 选择列
print(df['Name'])

# 选择行
print(df[df['Age'] > 25])
  1. **数据清洗**:
python 复制代码
# 删除缺失值
df_cleaned = df.dropna()

# 填充缺失值
df_filled = df.fillna(value=0)
  1. **数据排序**:
python 复制代码
# 按年龄升序排序
df_sorted = df.sort_values(by='Age')

`

  1. **数据可视化**:
python 复制代码
import matplotlib.pyplot as plt

# 绘制年龄的直方图
df['Age'].hist()
plt.show()

Pandas 是一个非常强大的库,可以用于数据导入、清洗、处理、分析和可视化。以上只是一些基础用法,Pandas 的功能远不止这些,它还有更多高级功能等待你去探索。

相关推荐
柯大侠爱喝水2 天前
python pandas ,处理csv文件、hdf5文件、parquet文件效率详细对比
python·pandas·csv·hdf5·parquet
阡之尘埃2 天前
Python自动化小技巧24——实现自动化输出模板表格报告
开发语言·python·数据分析·自动化·excel·pandas
神奇夜光杯3 天前
Python酷库之旅-第三方库Pandas(218)
开发语言·人工智能·python·excel·pandas·标准库及第三方库·学习与成长
用一个不重复的昵称6 天前
python数据写入excel文件
python·excel·pandas
神奇夜光杯6 天前
Python酷库之旅-第三方库Pandas(211)
开发语言·人工智能·python·excel·pandas·标准库及第三方库·学习与成长
神奇夜光杯6 天前
Python酷库之旅-第三方库Pandas(208)
开发语言·人工智能·python·excel·pandas·标准库及第三方库·学习与成长
阡之尘埃8 天前
Python数据分析案例64——杭帮菜美食探索数据分析可视化
python·数据挖掘·数据分析·pandas·数据可视化·美食·杭帮菜
python1569 天前
Python实战:Pandas数据筛选的高效方法
开发语言·python·pandas
神奇夜光杯11 天前
Python酷库之旅-第三方库Pandas(202)
开发语言·人工智能·python·excel·pandas·标准库及第三方库·学习与成长
写代码的小阿帆12 天前
深度学习—Pandas标签库基础
深度学习·pandas