DataFrame中.iloc 属性

.iloc 是 Pandas 库中 DataFrame 和 Series 对象的一个属性,用于基于整数位置的索引来选择数据。与基于标签的 .loc 索引不同,.iloc 使用从 0 开始的整数位置来访问行和列。这对于处理需要按位置而不是按标签选择数据的场景非常有用。

目录

基本用法

代码示例

常见错误


基本用法

  1. 选择单行或单列
    • 使用单个整数来选择单行或单列。
    • 例如,df.iloc[0] 选择第一行,df.iloc[:, 0] 选择第一列。
  2. 选择多行或多列
    • 使用整数列表或切片来选择多行或多列。
    • 例如,df.iloc[0:3] 选择前三行,df.iloc[:, 0:2] 选择前两列。
  3. 选择特定位置的元素
    • 使用两个整数来选择特定位置的单个元素。
    • 例如,df.iloc[0, 0] 选择第一行第一列的元素。
  4. 布尔索引结合使用
    • 可以与布尔数组结合使用来选择特定条件的行。
    • 例如,df.iloc[df['column_name'] > value] 选择满足条件的行(虽然这更常用 .loc 来实现)。

代码示例

设一个 DataFrame df

复制代码
import pandas as pd  
  
data = {  
    'A': [1, 2, 3, 4],  
    'B': [5, 6, 7, 8],  
    'C': [9, 10, 11, 12]  
}  
df = pd.DataFrame(data)

选择第一行

复制代码
print(df.iloc[0])

输出

复制代码
A    1  
B    5  
C    9  
Name: 0, dtype: int64

选择前两列

复制代码
print(df.iloc[:, 0:2])

输出

复制代码
A  B  
0  1  5  
1  2  6  
2  3  7  
3  4  8

选择第一行第二列的元素

复制代码
print(df.iloc[0, 1])

输出

复制代码
5

选择第二和第四行

复制代码
print(df.iloc[[1, 3]])

输出

复制代码
A  B   C  
1  2  6  10  
3  4  8  12

常见错误

复制代码
df = pd.read_excel('0_data.xlsx', engine='openpyxl')
z1 = df[['z1_x', 'z1_y']]
print( z1[1])

使用 pandasread_excel 函数从 Excel 文件 '0_data.xlsx' 中读取数据,并将其存储在 DataFrame df 中。接着从 df 中选择了不同的列来创建新的 DataFrame 或 Series 对象:z1 包含 'z1_x''z1_y' 列。

然而,在打印 z1[1] 时,z1[1] 实际上并不会打印出 z1 DataFrame 中的第二行(在 pandas 中,索引通常是从 0 开始的)。相反,z1[1] 会尝试基于列标签来选择数据,因为传递了一个整数给 DataFrame 的 __getitem__ 方法,而该方法首先会尝试将其解释为列标签(如果它看起来像是一个有效的列名或可以被解释为列名的某种形式)。

但是,因为 1 不是一个有效的列名,所以这里的行为实际上取决于 pandas 的版本和内部实现------在某些情况下,它可能会抛出一个错误,而在其他情况下,它可能会尝试将整数解释为位置索引(尽管这通常不是推荐的做法,因为它可能会导致混淆)。

要正确地按位置索引选择 DataFrame 中的行,应该使用 .iloc 属性,如下所示:

复制代码
print(z1.iloc[1])

这将打印出 z1 DataFrame 中的第二行(索引为 1 的行)。

如果 Excel 文件中的列名确实包含空格或特殊字符(比如 la1la2),并且在代码中也是按原样引用的这些列名,需要确保 Excel 文件中的列名与在代码中使用的完全匹配(包括大小写)。

相关推荐
husterlichf1 天前
pandas__unstack方法与set_index详解
数据挖掘·数据分析·pandas
wudl55664 天前
Pandas-之数据可视化
信息可视化·数据分析·pandas
万粉变现经纪人5 天前
如何解决 pip install 安装报错 [WinError 32] 文件被占用(杀毒/占用进程)问题
python·pycharm·flask·beautifulsoup·bug·pandas·pip
文人sec5 天前
使用python-pandas-openpyxl编写运营查询小工具
开发语言·python·pandas
咋吃都不胖lyh5 天前
比较两个excel文件的指定列是否一致
爬虫·python·pandas
IT小哥哥呀7 天前
Python实用技巧:批量处理Excel数据并生成销售报表(含实战案例)
python·pandas·数据可视化·数据处理·报表生成·excel自动化·办公神器
Serendipity_Carl8 天前
爬虫数据清洗可视化链家房源
python·pandas·matplotlib
husterlichf8 天前
pandas___get_dummies详解
pandas
wudl55669 天前
Pandas-数据清洗与缺失值处理
pandas