数据的简单处理——pandas模块——选择数据

要对读取的数据进行编辑,需要先学会选择数据的操作,如果选择行数据、列数据或者同时选择行列数据。

python 复制代码
##############################
##作者:白雪公主的后妈
##时间:2024年12月29日
##主题:数据的简单处理------pandas模块------选择数据
##############################
'''
要对读取的数据进行编辑,需要先学会选择数据的操作,如果选择行数据、列数据或者同时选择行列数据。
'''
#1、选择行数据        可以读取单行数据,也可以读取多行数据,还可以按照指定的条件选择行数据
import pandas as pd
date=pd.read_excel("E:\\python\\Python_Code\\Excel\\订单表.xlsx",sheet_name=1,index_col=0)
print(date)
#1.1选择单行数据      使用loc方法可以依据行标签选择单行数据
print(date.loc["d001"])
'''
运行结果:
       产品  数量    金额
订单编号               
d001  投影仪  5台  2000
d002  马克笔  5盒   300
d003  打印机  1台   298
d004  点钞机  1台   349
d005  复印纸  2箱   100
d006  条码纸  6卷    34

产品     投影仪
数量      5台
金额    2000
Name: d001, dtype: object
'''
#########使用iloc方法可以一句行序号(从0开始技计数)选择单行数据。
print(date.iloc[2])
'''
运行结果:
产品    打印机
数量     1台
金额    298
Name: d003, dtype: object
'''
#1.2选择多行数据      使用loc或者iloc除了选择单行外可以选择多行
print(date.loc[["d001","d003"]])
'''
运行结果:
       产品  数量    金额
订单编号               
d001  投影仪  5台  2000
d003  打印机  1台   298
'''
print(date.iloc[[1,4]])
'''
运行结果:
       产品  数量   金额
订单编号              
d002  马克笔  5盒  300
d005  复印纸  2箱  100
'''
#1.3选择满足条件的行
a=date["金额"]<300
print(date[a])
'''
      产品  数量   金额
订单编号              
d003  打印机  1台  298
d005  复印纸  2箱  100
d006  条码纸  6卷   34
'''
#2、选择列数据    第一种方法使用指定标签列读取,第二种方法使用iloc方法实现
import pandas as pd
date=pd.read_excel("E:\\python\\Python_Code\\Excel\\订单表.xlsx",sheet_name=1,index_col=0)
print(date)
#2.1选择单列数据      使用指定标签列读取
print(date["产品"])
'''
运行结果:
       产品  数量    金额
订单编号
d001  投影仪  5台  2000
d002  马克笔  5盒   300
d003  打印机  1台   298
d004  点钞机  1台   349
d005  复印纸  2箱   100
d006  条码纸  6卷    34

订单编号
d001    投影仪
d002    马克笔
d003    打印机
d004    点钞机
d005    复印纸
d006    条码纸
Name: 产品, dtype: object
'''
#1.2选择多行数据      使用标签列读取,除了选择单列外可以选择多列
print(date[["产品","数量"]])
'''
       产品  数量
订单编号         
d001  投影仪  5台
d002  马克笔  5盒
d003  打印机  1台
d004  点钞机  1台
d005  复印纸  2箱
d006  条码纸  6卷
'''
#############用iloc方法也可以选择多列数据
date=pd.read_excel("E:\\python\\Python_Code\\Excel\\订单表.xlsx",sheet_name=1,index_col=0)
print(date)
print(date.iloc[:,[0,2]])
'''
运行结果:
       产品    金额
订单编号           
d001  投影仪  2000
d002  马克笔   300
d003  打印机   298
d004  点钞机   349
d005  复印纸   100
d006  条码纸    34
'''
##################用iloc方法通过类似列表切片的方式实现。
print(date.iloc[:,0:2])
'''
运行结果:
       产品    金额
订单编号           
d001  投影仪  2000
d002  马克笔   300
d003  打印机   298
d004  点钞机   349
d005  复印纸   100
d006  条码纸    34
'''
#3、同时选择行列数据 可以选择loc或者iloc方式来实现
#3.1使用loc方法有行和列标签同时选择行列数据
date=pd.read_excel("E:\\python\\Python_Code\\Excel\\订单表.xlsx",sheet_name=1,index_col=0)
date1=date.loc[["d001","d005"],["产品","金额"]]
print(date1)
'''
选择行标签为"d001","d005"且列标签为"产品","金额"的数据。
运行结果:
       产品    金额
订单编号           
d001  投影仪  2000
d005  复印纸   100
'''
date2=date.iloc[[0,4],[0,2]]
print(date2)
'''
运行结果:
       产品    金额
订单编号           
d001  投影仪  2000
d005  复印纸   100
'''
相关推荐
阿尔的代码屋2 小时前
[大模型实战 07] 基于 LlamaIndex ReAct 框架手搓全自动博客监控 Agent
人工智能·python
AI探索者19 小时前
LangGraph StateGraph 实战:状态机聊天机器人构建指南
python
AI探索者19 小时前
LangGraph 入门:构建带记忆功能的天气查询 Agent
python
FishCoderh21 小时前
Python自动化办公实战:批量重命名文件,告别手动操作
python
躺平大鹅21 小时前
Python函数入门详解(定义+调用+参数)
python
曲幽1 天前
我用FastAPI接ollama大模型,差点被asyncio整崩溃(附对话窗口实战)
python·fastapi·web·async·httpx·asyncio·ollama
两万五千个小时1 天前
落地实现 Anthropic Multi-Agent Research System
人工智能·python·架构
哈里谢顿1 天前
Python 高并发服务限流终极方案:从原理到生产落地(2026 实战指南)
python
用户8356290780512 天前
无需 Office:Python 批量转换 PPT 为图片
后端·python
markfeng82 天前
Python+Django+H5+MySQL项目搭建
python·django