使用openpyxl轻松操控Excel文件

目录

  • [1. `openpyxl` 简介](#1. openpyxl 简介)
  • [2. 安装与快速入门](#2. 安装与快速入门)
    • [2.1 安装 `openpyxl`](#2.1 安装 openpyxl)
    • [2.2 快速创建一个 Excel 文件](#2.2 快速创建一个 Excel 文件)
    • [2.3 读取 Excel 文件](#2.3 读取 Excel 文件)
  • [3. `openpyxl` 的核心概念](#3. openpyxl 的核心概念)
    • [3.1 工作簿(Workbook)](#3.1 工作簿(Workbook))
    • [3.2 工作表(Worksheet)](#3.2 工作表(Worksheet))
    • [3.3 单元格(Cell)](#3.3 单元格(Cell))
    • [3.4 行与列](#3.4 行与列)
    • [3.5 范围(Range)](#3.5 范围(Range))
    • [3.6 公式与函数](#3.6 公式与函数)
    • [3.7 样式与格式](#3.7 样式与格式)
  • [4. Excel 文件的读取与写入](#4. Excel 文件的读取与写入)
    • [4.1 读取 Excel 文件](#4.1 读取 Excel 文件)
    • [4.2 写入 Excel 文件](#4.2 写入 Excel 文件)
    • [4.3 实践:批量修改单元格](#4.3 实践:批量修改单元格)
  • [5. 高级功能详解](#5. 高级功能详解)
    • [5.1 操作公式](#5.1 操作公式)
    • [5.2 添加图表](#5.2 添加图表)
    • [5.3 插入图片](#5.3 插入图片)
    • [5.4 数据验证](#5.4 数据验证)
    • [5.5 条件格式](#5.5 条件格式)
  • [6. 样式与格式设置](#6. 样式与格式设置)
    • [6.1 字体样式](#6.1 字体样式)
    • [6.2 单元格填充](#6.2 单元格填充)
    • [6.3 边框设置](#6.3 边框设置)
    • [6.4 对齐方式](#6.4 对齐方式)
    • [6.5 数字格式](#6.5 数字格式)
    • [6.6 合并与拆分单元格](#6.6 合并与拆分单元格)
    • [6.7 实践:制作格式化报表](#6.7 实践:制作格式化报表)

1. openpyxl 简介

Python 的 openpyxl 库是处理 Excel 文件的强大工具。在数据分析、自动化办公和报告生成等领域,经常需要对 Excel 文件进行读取、修改和创建操作。openpyxl 提供了全面的功能,允许开发者以编程方式操纵 Excel 文件,从而提高工作效率并减少手动操作的错误。

具体来讲,openpyxl 是一个用于读取和写入 Microsoft Excel 2010 xlsx/xlsm/xltx/xltm 文件的开源库。与其他处理 Excel 文件的库相比,openpyxl 专注于对现代 Excel 格式(即基于 XML 的 .xlsx 文件)的支持。

主要特点包括:

  • 读取和写入 Excel 文件:支持对单元格、行、列、工作表和工作簿的操作。
  • 格式化:可以修改单元格的字体、颜色、边框和对齐方式等格式属性。
  • 图表和图片:支持在工作表中插入图表和图片,增强数据的可视化。
  • 公式:能够读取和设置单元格中的公式,支持计算公式结果。

2. 安装与快速入门

2.1 安装 openpyxl

在开始使用 openpyxl 之前,需要先进行安装。可以通过 pip 进行安装:

bash 复制代码
pip install openpyxl

确保您的 Python 版本在 3.6 及以上,因为较早的版本可能不支持部分功能。

2.2 快速创建一个 Excel 文件

以下是一个使用 openpyxl 创建简单 Excel 文件的示例:

python 复制代码
import openpyxl
from openpyxl import Workbook

# 创建一个新的工作簿
wb = Workbook()

# 激活默认的工作表
ws = wb.active

# 在单元格中写入数据
ws['A1'] = 'Hello'
ws['B1'] = 'World!'

# 保存工作簿
wb.save('hello_world.xlsx')

运行上述代码后,将在当前目录下生成一个名为 hello_world.xlsx 的 Excel 文件,内容如下:

A B
Hello World!

2.3 读取 Excel 文件

openpyxl 还可以读取已有的 Excel 文件。下面是读取刚才创建的文件并打印单元格内容的示例:

python 复制代码
import openpyxl

# 加载已有的工作簿
wb = openpyxl.load_workbook('hello_world.xlsx')

# 选择活动的工作表
ws = wb.active

# 读取并打印单元格内容
print(ws['A1'].value)  # 输出: Hello
print(ws['B1'].value)  # 输出: World!

通过以上简单的示例,我们已经了解了如何使用 openpyxl 创建和读取 Excel 文件。在接下来的章节中,我们将详细介绍 openpyxl 的核心概念和高级功能。

3. openpyxl 的核心概念

在使用 openpyxl 操作 Excel 文件时,需要理解一些核心概念,这将有助于我们更有效地利用该库。

3.1 工作簿(Workbook)

工作簿是 Excel 文件的顶层容器,包含了所有的工作表、全局设置和属性。

  • 创建工作簿wb = Workbook()
  • 加载工作簿wb = load_workbook(filename)

3.2 工作表(Worksheet)

工作簿包含一个或多个工作表,每个工作表都是一个二维的单元格网格。

  • 激活工作表ws = wb.active
  • 创建新工作表ws = wb.create_sheet(title='SheetName')
  • 访问特定工作表ws = wb['SheetName']

3.3 单元格(Cell)

单元格是工作表中的基本元素,包含数据、样式和其他属性。

  • 访问单元格cell = ws['A1']cell = ws.cell(row=1, column=1)
  • 设置单元格值ws['A1'] = 'Data'
  • 获取单元格值value = ws['A1'].value

3.4 行与列

可以通过行和列来批量操作单元格。

  • 迭代行for row in ws.iter_rows(min_row=1, max_col=3, max_row=2):
  • 迭代列for col in ws.iter_cols(min_row=1, max_col=3, max_row=2):

3.5 范围(Range)

范围是指一组连续的单元格,可以对其进行批量操作。

  • 访问范围cell_range = ws['A1:C3']

3.6 公式与函数

可以在单元格中使用公式,openpyxl 支持 Excel 的大部分公式。

  • 设置公式ws['A2'] = '=SUM(A1:A10)'
  • 读取公式结果 :需要在 Excel 中打开文件,或使用 data_only 参数加载工作簿。
python 复制代码
wb = load_workbook('formula.xlsx', data_only=True)

3.7 样式与格式

openpyxl 提供了丰富的样式和格式选项,可以设置字体、颜色、对齐方式等。

设置字体

python 复制代码
from openpyxl.styles import Font
ws['A1'].font = Font(name='Calibri', size=14, bold=True)

设置填充颜色

python 复制代码
from openpyxl.styles import PatternFill
ws['A1'].fill = PatternFill(fill_type='solid', start_color='FF0000')

4. Excel 文件的读取与写入

在数据处理过程中,读取和写入 Excel 文件是最常见的操作。openpyxl 提供了简单直观的方法来完成这些任务。

4.1 读取 Excel 文件

加载工作簿

使用 load_workbook 函数加载已有的 Excel 文件:

python 复制代码
from openpyxl import load_workbook

wb = load_workbook('data.xlsx')

选择工作表

可以通过多种方式选择工作表:

使用工作表名称:

python 复制代码
ws = wb['Sheet1']

使用 active 属性:

python 复制代码
ws = wb.active

读取单元格数据

读取单元格的值:

python 复制代码
value = ws['A1'].value

或者使用行列索引:

python 复制代码
value = ws.cell(row=1, column=1).value

遍历数据

遍历所有行和列:

python 复制代码
for row in ws.iter_rows(values_only=True):
    print(row)

4.2 写入 Excel 文件

写入单元格

在特定单元格中写入数据:

python 复制代码
ws['A1'] = 'New Data'

或者使用行列索引:

python 复制代码
ws.cell(row=1, column=1, value='New Data')

插入行和列

插入一行:

python 复制代码
ws.insert_rows(idx=2)

插入一列:

python 复制代码
ws.insert_cols(idx=3)

删除行和列

删除一行:

python 复制代码
ws.delete_rows(idx=2)

删除一列:

python 复制代码
ws.delete_cols(idx=3)

保存工作簿

完成所有修改后,保存工作簿:

python 复制代码
wb.save('modified_data.xlsx')

4.3 实践:批量修改单元格

假设我们有一个成绩表,需要将所有学生的成绩提高 5 分。

python 复制代码
from openpyxl import load_workbook

wb = load_workbook('scores.xlsx')
ws = wb.active

# 假设成绩在 B 列,从第 2 行开始
for row in ws.iter_rows(min_row=2, min_col=2, max_col=2):
    for cell in row:
        if isinstance(cell.value, (int, float)):
            cell.value += 5

wb.save('updated_scores.xlsx')

通过以上操作,我们成功地批量修改了 Excel 文件中的数据。

5. 高级功能详解

openpyxl 不仅可以进行基本的读取和写入操作,还提供了许多高级功能,例如图表、图片和数据验证等。

5.1 操作公式

可以在单元格中写入公式:

python 复制代码
ws['A10'] = '=SUM(A1:A9)'

openpyxl 不会自动计算公式结果,但可以通过设置 data_only=True 来读取公式计算后的值:

python 复制代码
wb = load_workbook('formula.xlsx', data_only=True)
ws = wb.active
print(ws['A10'].value)

5.2 添加图表

以创建柱状图为例:

python 复制代码
from openpyxl.chart import BarChart, Reference

chart = BarChart()
data = Reference(ws, min_col=2, min_row=1, max_row=10)
chart.add_data(data, titles_from_data=True)
ws.add_chart(chart, 'E5')

可以设置图表的标题、轴标签等属性:

python 复制代码
chart.title = "Sales Chart"
chart.x_axis.title = "Month"
chart.y_axis.title = "Sales"

5.3 插入图片

python 复制代码
from openpyxl.drawing.image import Image

img = Image('logo.png')

添加图片到工作表:

python 复制代码
ws.add_image(img, 'A1')

5.4 数据验证

可以添加数据验证来限制单元格的输入内容。

创建数据验证对象

python 复制代码
from openpyxl.worksheet.datavalidation import DataValidation

dv = DataValidation(type="whole", operator="between", formula1=1, formula2=100)

添加数据验证到工作表

python 复制代码
dv.add('A1:A10')
ws.add_data_validation(dv)

5.5 条件格式

根据单元格的值,动态地改变单元格的格式。

创建条件格式规则

python 复制代码
from openpyxl.formatting.rule import CellIsRule
from openpyxl.styles import PatternFill

red_fill = PatternFill(start_color='FFC7CE', end_color='FFC7CE', fill_type='solid')

ws.conditional_formatting.add('A1:A10', CellIsRule(operator='greaterThan', formula=['80'], fill=red_fill))

通过以上高级功能的介绍,可以看出 openpyxl 在处理 Excel 文件时具有非常强大的能力,足以满足大多数复杂的需求。

6. 样式与格式设置

为了使 Excel 文件更加美观和专业,openpyxl 提供了丰富的样式和格式设置选项。

6.1 字体样式

设置字体

python 复制代码
from openpyxl.styles import Font

bold_font = Font(bold=True)
italic_font = Font(italic=True)

ws['A1'].font = bold_font
ws['A2'].font = italic_font

设置字体颜色和大小

python 复制代码
from openpyxl.styles import Font, colors

font_style = Font(color=colors.RED, size=14, name='Arial')
ws['A1'].font = font_style

6.2 单元格填充

设置背景颜色

python 复制代码
from openpyxl.styles import PatternFill

fill = PatternFill(fill_type='solid', start_color='FFFF00', end_color='FFFF00')
ws['A1'].fill = fill

6.3 边框设置

添加边框

python 复制代码
from openpyxl.styles import Border, Side

thin_border = Border(left=Side(style='thin'),
                     right=Side(style='thin'),
                     top=Side(style='thin'),
                     bottom=Side(style='thin'))

ws['A1'].border = thin_border

6.4 对齐方式

设置对齐方式

python 复制代码
from openpyxl.styles import Alignment

alignment = Alignment(horizontal='center', vertical='center')
ws['A1'].alignment = alignment

6.5 数字格式

设置数字格式

python 复制代码
ws['A1'].number_format = '0.00'  # 保留两位小数

6.6 合并与拆分单元格

合并单元格

python 复制代码
ws.merge_cells('A1:C1')

拆分单元格

python 复制代码
ws.unmerge_cells('A1:C1')

6.7 实践:制作格式化报表

python 复制代码
from openpyxl import Workbook
from openpyxl.styles import Font, Alignment, Border, Side

wb = Workbook()
ws = wb.active

# 写入表头
headers = ['姓名', '数学', '英语', '总分']
ws.append(headers)

# 添加数据
data = [
    ['张三', 85, 92],
    ['李四', 78, 88],
    ['王五', 90, 95]
]

for row in data:
    total = row[1] + row[2]
    row.append(total)
    ws.append(row)

# 设置表头样式
for cell in ws[1]:
    cell.font = Font(bold=True)
    cell.alignment = Alignment(horizontal='center')
    cell.border = Border(bottom=Side(style='thin'))

# 设置列宽
ws.column_dimensions['A'].width = 15
for col in ['B', 'C', 'D']:
    ws.column_dimensions[col].width = 10

# 保存工作簿
wb.save('report.xlsx')

通过以上代码,我们生成了一个格式化的成绩报表,包含表头加粗、单元格对齐、边框和列宽设置。

相关推荐
IT_Beijing_BIT16 分钟前
Python库matplotlib之二
开发语言·python·matplotlib
木鬼与槐18 分钟前
Python(七)- 文件操作
python
沪上小姐18 分钟前
python函数综合应用--银行小程序
python
九圣残炎20 分钟前
【Python游戏开发】扫雷游戏demo
python·游戏·mu编辑器
咕噜Yuki06091 小时前
Python爬虫获取指定内容
开发语言·爬虫·python
跟德姆(dom)一起学AI1 小时前
0基础跟德姆(dom)一起学AI 数据处理和统计分析08-日期类型处理,Matplotlib介绍
开发语言·人工智能·python·信息可视化·numpy·matplotlib
风控牛1 小时前
【注册/登录安全分析报告:孔夫子旧书网】
python·安全·网易易盾·极验·行为验证
逆境清醒1 小时前
PyCharm 社区版(2024.2.3)安装、配置、创建项目
ide·python·pycharm
学地理的小胖砸1 小时前
【高分系列卫星简介——高分五号卫星(GF-5)】
开发语言·python·信息可视化·遥感·地理信息
一颗星星辰1 小时前
Python | 第六章节 | 控制结构
开发语言·网络·python