数据的简单处理——pandas模块——选择数据

要对读取的数据进行编辑,需要先学会选择数据的操作,如果选择行数据、列数据或者同时选择行列数据。

python 复制代码
##############################
##作者:白雪公主的后妈
##时间:2024年12月29日
##主题:数据的简单处理------pandas模块------选择数据
##############################
'''
要对读取的数据进行编辑,需要先学会选择数据的操作,如果选择行数据、列数据或者同时选择行列数据。
'''
#1、选择行数据        可以读取单行数据,也可以读取多行数据,还可以按照指定的条件选择行数据
import pandas as pd
date=pd.read_excel("E:\\python\\Python_Code\\Excel\\订单表.xlsx",sheet_name=1,index_col=0)
print(date)
#1.1选择单行数据      使用loc方法可以依据行标签选择单行数据
print(date.loc["d001"])
'''
运行结果:
       产品  数量    金额
订单编号               
d001  投影仪  5台  2000
d002  马克笔  5盒   300
d003  打印机  1台   298
d004  点钞机  1台   349
d005  复印纸  2箱   100
d006  条码纸  6卷    34

产品     投影仪
数量      5台
金额    2000
Name: d001, dtype: object
'''
#########使用iloc方法可以一句行序号(从0开始技计数)选择单行数据。
print(date.iloc[2])
'''
运行结果:
产品    打印机
数量     1台
金额    298
Name: d003, dtype: object
'''
#1.2选择多行数据      使用loc或者iloc除了选择单行外可以选择多行
print(date.loc[["d001","d003"]])
'''
运行结果:
       产品  数量    金额
订单编号               
d001  投影仪  5台  2000
d003  打印机  1台   298
'''
print(date.iloc[[1,4]])
'''
运行结果:
       产品  数量   金额
订单编号              
d002  马克笔  5盒  300
d005  复印纸  2箱  100
'''
#1.3选择满足条件的行
a=date["金额"]<300
print(date[a])
'''
      产品  数量   金额
订单编号              
d003  打印机  1台  298
d005  复印纸  2箱  100
d006  条码纸  6卷   34
'''
#2、选择列数据    第一种方法使用指定标签列读取,第二种方法使用iloc方法实现
import pandas as pd
date=pd.read_excel("E:\\python\\Python_Code\\Excel\\订单表.xlsx",sheet_name=1,index_col=0)
print(date)
#2.1选择单列数据      使用指定标签列读取
print(date["产品"])
'''
运行结果:
       产品  数量    金额
订单编号
d001  投影仪  5台  2000
d002  马克笔  5盒   300
d003  打印机  1台   298
d004  点钞机  1台   349
d005  复印纸  2箱   100
d006  条码纸  6卷    34

订单编号
d001    投影仪
d002    马克笔
d003    打印机
d004    点钞机
d005    复印纸
d006    条码纸
Name: 产品, dtype: object
'''
#1.2选择多行数据      使用标签列读取,除了选择单列外可以选择多列
print(date[["产品","数量"]])
'''
       产品  数量
订单编号         
d001  投影仪  5台
d002  马克笔  5盒
d003  打印机  1台
d004  点钞机  1台
d005  复印纸  2箱
d006  条码纸  6卷
'''
#############用iloc方法也可以选择多列数据
date=pd.read_excel("E:\\python\\Python_Code\\Excel\\订单表.xlsx",sheet_name=1,index_col=0)
print(date)
print(date.iloc[:,[0,2]])
'''
运行结果:
       产品    金额
订单编号           
d001  投影仪  2000
d002  马克笔   300
d003  打印机   298
d004  点钞机   349
d005  复印纸   100
d006  条码纸    34
'''
##################用iloc方法通过类似列表切片的方式实现。
print(date.iloc[:,0:2])
'''
运行结果:
       产品    金额
订单编号           
d001  投影仪  2000
d002  马克笔   300
d003  打印机   298
d004  点钞机   349
d005  复印纸   100
d006  条码纸    34
'''
#3、同时选择行列数据 可以选择loc或者iloc方式来实现
#3.1使用loc方法有行和列标签同时选择行列数据
date=pd.read_excel("E:\\python\\Python_Code\\Excel\\订单表.xlsx",sheet_name=1,index_col=0)
date1=date.loc[["d001","d005"],["产品","金额"]]
print(date1)
'''
选择行标签为"d001","d005"且列标签为"产品","金额"的数据。
运行结果:
       产品    金额
订单编号           
d001  投影仪  2000
d005  复印纸   100
'''
date2=date.iloc[[0,4],[0,2]]
print(date2)
'''
运行结果:
       产品    金额
订单编号           
d001  投影仪  2000
d005  复印纸   100
'''
相关推荐
zyxczyf12319 小时前
软件工程test
python
阿水实证通19 小时前
DoubleML+FLAML实现双重机器学习超参数的自动调优(python实现路径)
人工智能·python·机器学习·实证分析
lkbhua莱克瓦2419 小时前
反射4-反射获取成员变量
java·开发语言·servlet·反射
dawnButterfly19 小时前
C 语言标准、编译器与操作系统的关系
c语言·开发语言·c++
风景的人生19 小时前
一台电脑上可以同时运行多个JVM(Java虚拟机)实例
java·开发语言·jvm
攻城狮之路人甲19 小时前
用pycharm写的程序,点击.py无法运行闪退
ide·python·pycharm
syt_biancheng19 小时前
大规模考试系统性能优化与风险评估
python·功能测试·selenium·性能优化·postman
李小星同志19 小时前
Flowing from Reasoning to Motion: Learning 3D Hand Trajectory Prediction论文学习
学习
世转神风-19 小时前
qt-float转QByteArray-二进制存储-数据存储(IEEE 754标准)
开发语言·qt
linksinke19 小时前
在windows系统上搭建Golang多版本管理器(g)的配置环境
开发语言·windows·golang