文章目录
前言
python可以很方便的操作各种文档,比如docx,xlsx等。本文主要介绍在xlsx文档中合并单元格的做法,并由此引申出一个很常见的应用场景,如何在一个xlsx文档中对具有层次关系的单元格数据进行合并。
一、openpyxl是什么?
openpyxl是一款基于python的操作xlsx文件代码库。python自带的xlrd 和 xlwt则无法操作xlsx文件,只能操作xls文件,而openpyxl可以读取,创建和修改xlsx文件,是一个功能强大的工具库。
二、基础用法
1.读取和写入文件
代码如下(示例):
python
workbook = openpyxl.load_workbook(file_path)
# 获取活动工作表
sheet1 = workbook.active
sheet1 = workbook["Sheet1"]
sheet1 = workbook.worksheets[0]
print(sheet1["A1"].value)
# 读取所有的数据
for row in sheet1.rows:
for col in row:
print(col.value)
# 加载已有的工作簿
workbook = openpyxl.load_workbook(file_path)
# 获取指定工作表,这里假设工作表名为 'Sheet1'
sheet = workbook['Sheet1']
# 在已有数据基础上追加一行数据
new_row = ["xxxx"]
sheet.append(new_row)
# 保存修改后的工作簿
workbook.save(file_path)
2.合并单元格
代码如下(示例):
c
workbook = openpyxl.load_workbook(file_path)
# 获取活动工作表
sheet = workbook.active
# 合并 第一列的第一个和第二个单元格为1个
sheet.merge_cells(start_row=1,
end_row=2,
start_column=1,
end_column=1)
三、合并单元格实战
存在一个嵌套字典,想把这个字典展示在xlsx表格中,应该如何展示?
直观地想,可以将遍历嵌套字典的所有路径,然后将路径写入表格中,但是这种写法会导致数据冗余,不符合阅读习惯。因此,需要使用合并单元格来进行消消乐。
1.连续相同元素的索引范围
python
def find_consecutive_ranges(lst):
"""
输入: ["xx", 23, "xx", "xx"]
输出: [(0, 0), (1,1), (2,3)]
输入: ["xx", xx, "xx", "xx"]
输出: [(0, 3)]
需求是找出列表中连续相同元素的索引范围
"""
ranges = []
if not lst:
return ranges
start = 0
for i in range(1, len(lst)):
if lst[i] != lst[start]:
ranges.append((start, i - 1))
start = i
# 处理最后一组元素
ranges.append((start, len(lst) - 1))
return ranges
上述代码可以找到任意一列中连续相同元素的索引,可以利用合并函数进行合并。
2.转换
python
def transform_arr(A):
"""
将二维数组A转成二维数组C,二者的形状相同
对于每一个元素,将其前所有元素和该元素组成一个元组添加到结果数组 C 的当前行中。
"""
rows = len(A)
cols = len(A[0]) if rows > 0 else 0
C = []
for i in range(rows):
row = []
for j in range(cols):
element = []
for k in range(j+1):
element.append(A[i][k])
row.append(element)
C.append(row)
return C
A = [[1,2,3,4],
[1,2,5,4],
[4,3,2,1],
[4,3,2,5]]
print(transform_arr(A))
# 输出:
C = [[[1], [1, 2], [1, 2, 3], [1, 2, 3, 4]],
[[1], [1, 2], [1, 2, 5], [1, 2, 5, 4]],
[[4], [4, 3], [4, 3, 2], [4, 3, 2, 1]],
[[4], [4, 3], [4, 3, 2], [4, 3, 2, 5]]]
3.获取列合并索引
python
def fill_value(two_d_array):
# 针对 二维数组的 进行填充
# 使用 itertools.zip_longest 进行填充打包
import itertools
padded_zip = itertools.zip_longest(*two_d_array, fillvalue='')
arr = list(padded_zip)
return [list(row) for row in zip(*arr)]
def get_arr_merge_col_table(A):
"""
1、先将二维数组A转换成一个同样形状的二维数组
转换规律:函数 transform_arr
读者可以考虑如果不使用transform_arr函数后的效果
2、根据1中的结果使用函数find_consecutive_ranges后,
知道数组A中每列相同元素的索引
"""
# 可以补充每行的长度一致
A = fill_value(A)
# 读者可以屏蔽本行,同样可以运行,但是问题是什么??
A = transform_arr(A)
rows = len(A)
cols = len(A[0]) if rows > 0 else 0
# 初始化新的二维数组 D
D = []
for j in range(cols):
# 提取第 j 列
column = [A[i][j] for i in range(rows)]
# 使用函数 B 处理该列
processed_column = find_consecutive_ranges(column)
# 将处理后的列添加到 D 中
D.append(processed_column)
return D
A = [[1,2,3,4],
[1,2,5,4],
[4,3,2,1],
[4,3,2,5]]
print(get_arr_merge_col_table(A))
# 输出:
C = [[(0, 1), (2, 3)],
[(0, 1), (2, 3)],
[(0, 0), (1, 1), (2, 3)],
[(0, 0), (1, 1), (2, 2), (3, 3)]]
上述代码可以将每一列中连续相同元素的索引找出来,方便后续进行合并
4.整体
python
import openpyxl
def load_data(file_path):
# 加载 Excel 文件
workbook = openpyxl.load_workbook(file_path)
# 获取活动工作表
sheet = workbook.active
# 获取原始数据
data = []
# 遍历工作表的每一行
for row in sheet.iter_rows(values_only=True):
data.append(list(row))
return data
def merge_cells_in_excel(file_path, merge_index_table):
# 加载 Excel 文件
workbook = openpyxl.load_workbook(file_path)
# 获取活动工作表
sheet = workbook.active
# 也可以使用行和列的索引来指定合并范围
for col_index, col_index_list in enumerate(merge_index_table, 1):
for col_index_tuple in col_index_list:
sheet.merge_cells(start_row=col_index_tuple[0] + 1,
end_row=col_index_tuple[1] + 1,
start_column=col_index,
end_column=col_index)
# 保存修改后的 Excel 文件
workbook.save(file_path)
return workbook
file_path = "test.xlsx"
excel_data = load_data(file_path=file_path)
merge_index_table = get_arr_merge_col_table(excel_data)
merge_cells_in_excel(file_path, merge_index_table)
test.xlsx文件合并前:
合并后:
总结
本文简单介绍了openpyxl的用法,然后针对合并单元格的特殊场景用法给出了实例。