DataFrame中.iloc 属性

.iloc 是 Pandas 库中 DataFrame 和 Series 对象的一个属性,用于基于整数位置的索引来选择数据。与基于标签的 .loc 索引不同,.iloc 使用从 0 开始的整数位置来访问行和列。这对于处理需要按位置而不是按标签选择数据的场景非常有用。

目录

基本用法

代码示例

常见错误


基本用法

  1. 选择单行或单列
    • 使用单个整数来选择单行或单列。
    • 例如,df.iloc[0] 选择第一行,df.iloc[:, 0] 选择第一列。
  2. 选择多行或多列
    • 使用整数列表或切片来选择多行或多列。
    • 例如,df.iloc[0:3] 选择前三行,df.iloc[:, 0:2] 选择前两列。
  3. 选择特定位置的元素
    • 使用两个整数来选择特定位置的单个元素。
    • 例如,df.iloc[0, 0] 选择第一行第一列的元素。
  4. 布尔索引结合使用
    • 可以与布尔数组结合使用来选择特定条件的行。
    • 例如,df.iloc[df['column_name'] > value] 选择满足条件的行(虽然这更常用 .loc 来实现)。

代码示例

设一个 DataFrame df

复制代码
import pandas as pd  
  
data = {  
    'A': [1, 2, 3, 4],  
    'B': [5, 6, 7, 8],  
    'C': [9, 10, 11, 12]  
}  
df = pd.DataFrame(data)

选择第一行

复制代码
print(df.iloc[0])

输出

复制代码
A    1  
B    5  
C    9  
Name: 0, dtype: int64

选择前两列

复制代码
print(df.iloc[:, 0:2])

输出

复制代码
A  B  
0  1  5  
1  2  6  
2  3  7  
3  4  8

选择第一行第二列的元素

复制代码
print(df.iloc[0, 1])

输出

复制代码
5

选择第二和第四行

复制代码
print(df.iloc[[1, 3]])

输出

复制代码
A  B   C  
1  2  6  10  
3  4  8  12

常见错误

复制代码
df = pd.read_excel('0_data.xlsx', engine='openpyxl')
z1 = df[['z1_x', 'z1_y']]
print( z1[1])

使用 pandasread_excel 函数从 Excel 文件 '0_data.xlsx' 中读取数据,并将其存储在 DataFrame df 中。接着从 df 中选择了不同的列来创建新的 DataFrame 或 Series 对象:z1 包含 'z1_x''z1_y' 列。

然而,在打印 z1[1] 时,z1[1] 实际上并不会打印出 z1 DataFrame 中的第二行(在 pandas 中,索引通常是从 0 开始的)。相反,z1[1] 会尝试基于列标签来选择数据,因为传递了一个整数给 DataFrame 的 __getitem__ 方法,而该方法首先会尝试将其解释为列标签(如果它看起来像是一个有效的列名或可以被解释为列名的某种形式)。

但是,因为 1 不是一个有效的列名,所以这里的行为实际上取决于 pandas 的版本和内部实现------在某些情况下,它可能会抛出一个错误,而在其他情况下,它可能会尝试将整数解释为位置索引(尽管这通常不是推荐的做法,因为它可能会导致混淆)。

要正确地按位置索引选择 DataFrame 中的行,应该使用 .iloc 属性,如下所示:

复制代码
print(z1.iloc[1])

这将打印出 z1 DataFrame 中的第二行(索引为 1 的行)。

如果 Excel 文件中的列名确实包含空格或特殊字符(比如 la1la2),并且在代码中也是按原样引用的这些列名,需要确保 Excel 文件中的列名与在代码中使用的完全匹配(包括大小写)。

相关推荐
王大傻09281 天前
Series创建
pandas
dubochao_xinxi2 天前
fastapi 接收10g 以上的文件 pandas 读取超过 10GB 的 Excel 文件
excel·pandas·fastapi
N***73853 天前
后端数据一致性
hdfs·pandas·sstable
江上月5134 天前
Pandas 高级教程:解锁数据分析的强大潜能
数据挖掘·数据分析·pandas
AI小云6 天前
【数据操作与可视化】Pandas数据处理-其他操作
python·pandas
飞梦工作室11 天前
突破 pandas 瓶颈:实时读写 Excel 与超透视汇总函数的双维解决方案
python·excel·pandas
Python大数据分析@12 天前
Vaex :突破pandas,快速分析100G大数据量
pandas
AI小云12 天前
【数据操作与可视化】Pandas数据处理-Series数据结构
开发语言·数据结构·python·numpy·pandas
小兔崽子去哪了14 天前
Numpy、Panads
python·numpy·pandas
一晌小贪欢14 天前
Pandas操作Excel使用手册大全:从基础到精通
开发语言·python·自动化·excel·pandas·办公自动化·python办公