介绍一个在数据分析中常用的函数:data.iloc[]

平时处理数据集中,总是需要选中一些列的数据,去预测其他列的数据,所以data.iloc[],在数据分析中显得尤为方便。

介绍一下data.iloc[]

data.iloc[] 是 Python 中 pandas 库的一个非常有用的功能,它允许你通过行和列的整数位置索引来选择数据。iloc 是 "integer location" 的缩写,意味着你可以通过指定行和列的整数索引来选择数据,而不是使用标签。

以下是一些使用 data.iloc[] 的基本示例:

  1. 选择单个元素

    使用 data.iloc[row_index, column_index] 来选择特定的元素。

    python 复制代码
    element = data.iloc[0, 1]  # 选择第1行第2列的元素
  2. 选择一行

    使用 data.iloc[i,:] 来选择第 i 行的所有列。

    python 复制代码
    row = data.iloc[2, :]  # 选择第3行的所有列
  3. 选择一列

    使用 data.iloc[:, j] 来选择第 j 列的所有行。

    python 复制代码
    column = data.iloc[:, 1]  # 选择第2列的所有行
  4. 选择多个行和列

    使用 data.iloc[i:m, j:n] 来选择从第 i 行到第 m 行,第 j 列到第 n 列的数据。

    python 复制代码
    sub_data = data.iloc[0:3, 1:4]  # 选择第1行到第3行,第2列到第4列的数据
  5. 使用切片
    iloc 也支持 Python 的切片语法,可以用于选择行或列的范围。

    python 复制代码
    sub_data_rows = data.iloc[0:5:2, :]  # 选择第1行到第5行,步长为2的行
    sub_data_cols = data.iloc[:, 1:5:2]  # 选择第2列到第5列,步长为2的列
  6. 选择多个不连续的行或列

    使用数组或列表来选择多个不连续的行或列。

    python 复制代码
    selected_rows = data.iloc[[0, 2, 4], :]  # 选择第1、3、5行的所有列
    selected_cols = data.iloc[:, [1, 3]]     # 选择第2、4列的所有行

请注意,在使用 iloc 时,索引是从0开始的,即第一行或第一列的索引是0。此外,iloc 只能用于选择行和列,不能用于选择 DataFrame 中的标签(即列名或索引)。如果你需要基于标签选择数据,应该使用 loc 而不是 iloc

在数据分析代码中的应用

这是在一个数据分析代码中的一部分,这里就用了iloc[]选取前两列作为特征数据,第三列作为目标变量(也就是通过前两列的值预测最后一列的数据)。

python 复制代码
# 1. 数据加载
data = pd.read_csv('data.csv')
X = data.iloc[:, :2]  # 取前两列作为特征
y = data.iloc[:, 2]  # 取第三列作为目标变量

# 2. 数据预处理
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)
相关推荐
量化交易曾小健(金融号)4 分钟前
人大计算金融课程名称:《机器学习》(题库)/《大数据与机器学习》(非题库) 姜昊教授
人工智能
IT_陈寒11 分钟前
Redis 性能翻倍的 5 个隐藏技巧,99% 的开发者都不知道第3点!
前端·人工智能·后端
W_chuanqi14 分钟前
RDEx:一种效果驱动的混合单目标优化器,自适应选择与融合多种算子与策略
人工智能·算法·机器学习·性能优化
好奇龙猫15 分钟前
[AI学习:SPIN -win-安装SPIN-工具过程 SPIN win 电脑安装=accoda 环境-第四篇:代码修复]
人工智能·学习
Pocker_Spades_A24 分钟前
AI搜索自由:Perplexica+cpolar构建你的私人知识引擎
人工智能
~kiss~25 分钟前
图像的脉冲噪声和中值滤波
图像处理·人工智能·计算机视觉
居7然28 分钟前
DeepSeek-7B-chat 4bits量化 QLora 微调
人工智能·分布式·架构·大模型·transformer
卡奥斯开源社区官方30 分钟前
OpenAI万亿美元计划技术拆解:AI智能体的架构演进与商业化实践
人工智能
熊猫钓鱼>_>34 分钟前
AI驱动的专业报告撰写:从信息整合到洞察生成的全新范式
大数据·人工智能·百度
宝杰X71 小时前
Compose Multiplatform+Kotlin Multiplatfrom 第七弹跨平台 AI开源
人工智能·开源·kotlin