一周学会Pandas2 Python数据处理与分析-Pandas2二维数据结构-DataFrame

锋哥原创的Pandas2 Python数据处理与分析 视频教程:

2025版 Pandas2 Python数据处理与分析 视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili

DataFrame是一个二维表格型数据结构。每列可以是不同的值类型,既有行索引index,也有列索引columns,可以看成是由Series组成的字典。

DataFrame创建基本格式:

复制代码
df = pd.DataFrame(data=None, index=None, columns=None)

参数说明:

  • data:具体数据,结构化或同构的ndarray、可迭代对象、字典或DataFrame。

  • index:索引,类似数组的对象,支持解包,如果没有指定,会 自动生成RangeIndex (0, 1, 2, ..., n)。

  • columns:列索引、表头,如果没有指定,会自动生成 RangeIndex (0, 1, 2, ..., n)。

实际开发,我们还是从数据文件(如Excel,CSV)中读取数据。不过,了解这些知识可以让我们更好的掌握DataFrame数据机制。

使用字典方式定义DataFrame

示例:

复制代码
import pandas as pd
​
d = {'学号': [1, 2, 3],
     '姓名': ['张三', '李四', '王五'],
     '语文': [99, 88, 77],
     '数学': [44, 55, 55],
     '英语': [88, 55, 66]}
df = pd.DataFrame(d)
print(df)
print(df.dtypes)
print(df.columns) # 列索引
print(df.index) # 行索引

运行输出:

复制代码
   学号  姓名  语文  数学  英语
0   1  张三  99  44  88
1   2  李四  88  55  55
2   3  王五  77  55  66
学号     int64
姓名    object
语文     int64
数学     int64
英语     int64
dtype: object
Index(['学号', '姓名', '语文', '数学', '英语'], dtype='object')
RangeIndex(start=0, stop=3, step=1)

从DataFrame中查询Series

如果只查询一行或者一列,返回的就是Series对象,如果查询的是多行,多列,返回的还是DataFrame。

复制代码
print(df['姓名'], type(df['姓名']))  # 查询一列,返回Series
print(df['姓名'][1])
print(df[['姓名', '语文']], type(df[['姓名', '语文']]))  # 查询两列,返回DataFrame
print(df.loc[1], type(df.loc[1]))  # 查询一行,返回Series
print(df.loc[1]['姓名'], df.loc[1]['语文'])
print(df.loc[[0, 2]], type(df.loc[[0, 2]]))  # 查询多行,返回DataFrame
print(df.loc[1:2])  # 查询多行,支持切片

运行结果:

复制代码
**********查询数据****************
0    张三
1    李四
2    王五
Name: 姓名, dtype: object <class 'pandas.core.series.Series'>
  
李四
  
   姓名  语文
0  张三  99
1  李四  88
2  王五  77 <class 'pandas.core.frame.DataFrame'>
  
学号     2
姓名    李四
语文    88
数学    55
英语    55
Name: 1, dtype: object <class 'pandas.core.series.Series'>
  
李四 88
  
   学号  姓名  语文  数学  英语
0   1  张三  99  44  88
2   3  王五  77  55  66 <class 'pandas.core.frame.DataFrame'>
  
   学号  姓名  语文  数学  英语
1   2  李四  88  55  55
2   3  王五  77  55  66
相关推荐
草莓熊Lotso13 分钟前
【LangChain】聊天模型实战:结构化输出完全指南(从原理到落地)
数据库·python·langchain·软件工程
lili001214 分钟前
AI编程三件套CI集成与质量门禁:从“看起来对“到“证据确凿“
java·人工智能·python·ci/cd·ai编程
南境十里·墨染春水15 分钟前
数据结构 ——BST 树
数据结构
原来是猿16 分钟前
性能测试(1)
运维·服务器·python·压力测试
江屿风18 分钟前
C++图的基本概念流食般投喂-竞赛编
开发语言·数据结构·c++·笔记·算法·图论
Byte不洛24 分钟前
哈希表原理 + 冲突解决 + C++实现
数据结构·c++·算法·哈希算法·散列表
AIFQuant26 分钟前
外汇交易平台技术栈深度解析:行情 API、清算、风控、前端一体化方案
前端·python·websocket·金融·restful
花酒锄作田6 小时前
[python]argparse 包在聊天机器人中的应用
python
NiceCloud喜云9 小时前
Opus 4.8 的 Effort Control 怎么选:Low 到 Max 五档策略
android·java·大数据·前端·c++·python·spring
AI玫瑰助手9 小时前
Python函数:默认参数的定义与注意事项
开发语言·python·信息可视化