使用 Python 的第三方库 xlrd 读取 Excel 文件

使用 Python 的第三方库 xlrd 读取 Excel 文件

目录

  • [使用 Python 的第三方库 xlrd 读取 Excel 文件](#使用 Python 的第三方库 xlrd 读取 Excel 文件)

一、安装 xlrd 库

xlrd是读Excel的库,xlrd是第三方库,因此需要先安装才能使用。在Windows命令行窗口输入如下命令安装 xlrd库:

shell 复制代码
C:\Users\Administrator>pip install xlrd
Collecting xlrd
  Downloading xlrd-2.0.2-py2.py3-none-any.whl.metadata (3.5 kB)
Downloading xlrd-2.0.2-py2.py3-none-any.whl (96 kB)
Installing collected packages: xlrd
Successfully installed xlrd-2.0.2

[notice] A new release of pip is available: 25.2 -> 25.3
[notice] To update, run: python.exe -m pip install --upgrade pip

pip包进行更新:

shell 复制代码
C:\Users\Administrator>python.exe -m pip install --upgrade pip
Requirement already satisfied: pip in c:\users\administrator\appdata\local\programs\python\python313\lib\site-packages (25.2)
Collecting pip
  Downloading pip-25.3-py3-none-any.whl.metadata (4.7 kB)
Downloading pip-25.3-py3-none-any.whl (1.8 MB)
   ---------------------------------------- 1.8/1.8 MB 4.6 MB/s  0:00:00
Installing collected packages: pip
  Attempting uninstall: pip
    Found existing installation: pip 25.2
    Uninstalling pip-25.2:
      Successfully uninstalled pip-25.2
Successfully installed pip-25.3

由于所安装的第三方库默认是在国外的服务器上,所以可能会出现安装速度比较慢的情况。此时可以尝试使用国内镜像源的方式进行安装。国内镜像源网址如下:

清华大学:https://pypi.tuna.tsinghua.edu.cn/simple

阿里云:http:/mirrors.aliyun.com/pypi/simple

镜像源使用方式:在使用pip时添加参数-i https://pypi.tuna.tsinghua.edu.cn/simple

例如:pip install -i https://pypi.tuna.tsinghua.edu.cn/simple xlrd

二、使用 xlrd 库读取 Excel 文件

1、打开 Excel 工作表

理解工作簿、工作表、单元格区域、单元格等概念。

python 复制代码
import xlrd
# 使用 open_workbook 加载磁盘中的Excel文件
excelbook=xlrd.open_workbook(r"d:/资产清单.xlsx")

# 执行以上代码时程序报如下错误:
  File "C:/Users/Administrator/AppData/Local/Programs/Python/Python313/aa.py", line 2, in <module>
    excelbook=xlrd.open_workbook(r"d:/资产清单.xlsx")
  File "C:\Users\Administrator\AppData\Local\Programs\Python\Python313\Lib\site-packages\xlrd\__init__.py", line 170, in open_workbook
    raise XLRDError(FILE_FORMAT_DESCRIPTIONS[file_format]+'; not supported')
xlrd.biffh.XLRDError: Excel xlsx file; not supported

在 CSDN 搜索,给出的原因如下:通常是由于当前 Python 中的 xlrd 版本过高,高版本下删除了对应的 .xlsx 读取方法,或者 xlrd 更新到了 2.0.1 版本,只支持 .xls 文件。

解决方法为:重装指定版本的 xlrd。在命令行中先卸载现有的 xlrd,再安装指定版本的 xlrd。

shell 复制代码
C:\Users\Administrator>pip uninstall xlrd
Found existing installation: xlrd 2.0.2
Uninstalling xlrd-2.0.2:
  Would remove:
    c:\users\administrator\appdata\local\programs\python\python313\lib\site-packages\xlrd-2.0.2.dist-info\*
    c:\users\administrator\appdata\local\programs\python\python313\lib\site-packages\xlrd\*
    c:\users\administrator\appdata\local\programs\python\python313\scripts\runxlrd.py
Proceed (Y/n)? y
  Successfully uninstalled xlrd-2.0.2

C:\Users\Administrator>pip install xlrd==1.2.0
Collecting xlrd==1.2.0
  Downloading xlrd-1.2.0-py2.py3-none-any.whl.metadata (1.3 kB)
Downloading xlrd-1.2.0-py2.py3-none-any.whl (103 kB)
Installing collected packages: xlrd
Successfully installed xlrd-1.2.0

重新编写代码,加载 Excel 文件,获取工作表中的数据。

加载 Excel 文件,查看对象类型。代码如下:

python 复制代码
import xlrd
# 使用 open_workbook 加载磁盘中的Excel文件
excelbook=xlrd.open_workbook(r"d:/资产清单.xlsx")
print(type(excelbook))
print(excelbook)

程序运行结果为:
<class 'xlrd.book.Book'>
<xlrd.book.Book object at 0x00000215C84C7B60>

获取工作表对象信息。代码如下:

python 复制代码
import xlrd
excelbook=xlrd.open_workbook(r"d:/资产清单.xlsx")
# 按照工作表的序号获取第一个工作表对象信息
sht1=excelbook.sheet_by_index(0)  
# 按照工作表的名称获取工作表对象信息
sht2=excelbook.sheet_by_name("总资产")
# 获取所有的工作表信息,保存到一个列表中。
shts=excelbook.sheets()
# 获取列表中的第二个元素,即第二个工作表对象信息
sht3=shts[1]
print(type(sht1))
print(sht1)
print(sht2)
print(type(shts))
print(shts)
print(sht3)

程序运行结果为:
<class 'xlrd.sheet.Sheet'>
<xlrd.sheet.Sheet object at 0x000001A8AB867E00>
<xlrd.sheet.Sheet object at 0x000001A8AB867E00>
<class 'list'>
[<xlrd.sheet.Sheet object at 0x000001A8AB867E00>, <xlrd.sheet.Sheet object at 0x000001A8AB94C2D0>]
<xlrd.sheet.Sheet object at 0x000001A8AB94C2D0>
2、读取单个单元格的信息

获取单元格数据有两种方式:一是使用cell_value函数直接返回单元格的数据,该函数传递两个参数:单元格数值所在的行号和列号。另一种是使用cell函数,该函数仍然需要传递两个参数:行号和列号,但该函数返回的是一个单元格对象,需要使用该对象的value属性返回单元格中的数据。

常用的单元格数据类型包含如下几种:

0:empty------空

1:string------文本

2:number------数值

3:date------日期

4:boolean------逻辑值

5:error------错误

6:blank------空格

例如:

python 复制代码
import xlrd
excelbook=xlrd.open_workbook(r"d:/资产清单.xlsx")
# 获取第一个工作表对象信息
sht1=excelbook.sheets()[0]
# 获取第3行第2列的单元格的内容
x=sht1.cell(2,1).value
print(x)
print(type(x))
# 获取第3行第6列的单元格的内容
x=sht1.cell_value(2,5)
print(x)
print(type(x))

程序运行结果为:
家具
<class 'str'>
700.0
<class 'float'>
3、读取多个单元格的信息

使用工作表的nrows属性可以获取工作表总的有效行数,ncols属性可以获取工作表总的有效列数。

python 复制代码
import xlrd
excelbook=xlrd.open_workbook(r"d:/资产清单.xlsx")
rows=excelbook.sheets()[0].nrows
cols=excelbook.sheets()[0].ncols
print(rows)
print(cols)

程序运行结果为:
7
9

使用row(n)函数可以获取第n行数据,使用col(n)函数可以获取第n列数据。

python 复制代码
import xlrd
excelbook=xlrd.open_workbook(r"d:/资产清单.xlsx")
row=excelbook.sheets()[0].row(2)
print(row)
print(type(row))
print("==="*20)
print(row[1])
print(type(row[1]))
print("==="*20)
col=excelbook.sheets()[0].col(3)
print(col)
print(type(col))

程序运行结果为:
[number:2.0, text:'家具', text:'JJ2020021492', text:'目录柜', text:'50斗', number:700.0, text:'经济与管理学院办公室', text:'10号教学楼2楼10206', xldate:33329.0]
<class 'list'>
============================================================
text:'家具'
<class 'xlrd.sheet.Cell'>
============================================================
[text:'名称', text:'期刊架', text:'目录柜', text:'双面书桌', text:'双面书桌', text:'双面书桌', text:'双面书桌']
<class 'list'>

row(n)函数与 col(n)函数获取到的数据是一个列表,列表中元素的数据类型为<class 'xlrd.sheet.Cell'>,这是xlrd中的cell对象。也就是每一个列表元素表示的是一个单元格对象,单元格对象有value属性。因此,可以遍历列表获得每一个单元格对象,再通过value属性获取每一个单元格的值。

代码如下:

python 复制代码
import xlrd
excelbook=xlrd.open_workbook(r"d:/资产清单.xlsx")
rows=excelbook.sheets()[0].nrows
for row_id in range(rows):
    for cell in excelbook.sheets()[0].row(row_id):
        print(cell.value,end="   ")
    print("")
    
程序运行结果为:
序号   类别   编号   名称   型号   价值   领用单位   存放地   入库日期   
1.0   家具   JJ2020019977   期刊架   D型   590.0   经济与管理学院办公室   10号教学楼2楼10206   33329.0   
2.0   家具   JJ2020021492   目录柜   50斗   700.0   经济与管理学院办公室   10号教学楼2楼10206   33329.0   
3.0   家具   JJ2020023833   双面书桌   双面   410.0   经济与管理学院办公室   10号教学楼2楼10206   33329.0   
4.0   家具   JJ2020023834   双面书桌   双面   410.0   经济与管理学院办公室   10号教学楼2楼10206   33329.0   
5.0   家具   JJ2020023835   双面书桌   双面   410.0   经济与管理学院办公室   10号教学楼2楼10206   33329.0   
6.0   家具   JJ2020023836   双面书桌   双面   410.0   经济与管理学院办公室   10号教学楼2楼10206   33329.0   
相关推荐
历程里程碑25 分钟前
普通数组----合并区间
java·数据结构·python·算法·leetcode·职场和发展·tornado
weixin_3954489126 分钟前
mult_yolov5_post_copy.c_cursor_0205
c语言·python·yolo
执风挽^42 分钟前
Python基础编程题2
开发语言·python·算法·visual studio code
纤纡.1 小时前
PyTorch 入门精讲:从框架选择到 MNIST 手写数字识别实战
人工智能·pytorch·python
kjkdd1 小时前
6.1 核心组件(Agent)
python·ai·语言模型·langchain·ai编程
小镇敲码人1 小时前
剖析CANN框架中Samples仓库:从示例到实战的AI开发指南
c++·人工智能·python·华为·acl·cann
萧鼎1 小时前
Python 包管理的“超音速”革命:全面上手 uv 工具链
开发语言·python·uv
alvin_20052 小时前
python之OpenGL应用(二)Hello Triangle
python·opengl
铁蛋AI编程实战2 小时前
通义千问 3.5 Turbo GGUF 量化版本地部署教程:4G 显存即可运行,数据永不泄露
java·人工智能·python
jiang_changsheng2 小时前
RTX 2080 Ti魔改22GB显卡的最优解ComfyUI教程
python·comfyui