Python哪个Excel库最好用?

我用Python处理Excel使用最多的库是XlsxWriter和Pandas,Pandas不用多说,很适合将Excel转为DataFrame格式来处理数据。

这里重点讲讲XlsxWriter,非常擅长写入Excel。它在github上有近4K的star,在众多Excel库中可能也是最好用最容易上手的,它支持创建、写入、公式、图表设计、可视化、格式处理等各种Excel操作。

XlsxWriter最好用的点在于它不依赖其他库或者Excel引擎,单纯靠Python标准库执行任务,所以安装简单、速度快、出错率低、环境适应性强。

而且XlsxWriter非常适合Excel大数据的写入,因为它有一种特殊的"常量内存"管理模式,可以一边写入新数据,一边删除内存的中旧数据,不会占用内存,因此可以支持超大数据量的处理。

安装XlsxWriter很简单,直接在命令行中输入:

复制代码
pip install XlsxWriter

由于没有依赖库,XlsxWriter安装非常快,安装好后,使用import导入便可以使用。

比如以下几行代码,可以轻松创建一个excel表,然后写入一列数据,并使用这列数据创建一个折线图,速度非常之快。

复制代码
import xlsxwriter

# 要输入的数据
data = [12,15,18,20,17,14]
# 创建工作簿和工作表
workbook = xlsxwriter.https://zhida.zhihu.com/search?content_id=746130047&content_type=Answer&match_order=1&q=Workbook&zhida_source=entity('示例.xlsx')
worksheet = workbook.add_worksheet()

# 写入数据
worksheet.write_column('A1', data)

# 创建新的折线图对象
chart = workbook.add_chart({'type': 'line'})
# 向图表添加数据系列
chart.add_series({'values': '=Sheet1!$A$1:$A$6'})
# 将图表插入工作表
worksheet.insert_chart('C1', chart)

# 关闭xlsx文件
workbook.close()

效果如下:

要学会XlsxWriter,需要知道XlsxWriter有3个基础对象。

Workbook(工作薄):用于创建Excel文件,通过方法xlsxwriter.Workbook()实现。

Worksheet(工作表):用于创建Excel中的某个sheet,通过workbook.add_worksheet()实现。

Format(格式化):用于设置单元格格式的方法和属性,比如:字体、颜色、图案、边框、对齐方式和数字格式等,通过workbook.add_format()实现。

比如以下案例,就解释了以上3个对象的使用方法,创建一个Excel表及其sheet,并写入A1单元数值和设置格式。

复制代码
import xlsxwriter
# 创建Excel
workbook = xlsxwriter.Workbook('set_format.xlsx')
# 创建sheet
worksheet = workbook.add_worksheet()

# 设置单元格格式
currency_format = workbook.add_format({
    'num_format': '$#,##0.00', # 数字格式
    'bold': True,             # 字体加粗
    'font_name': '微软雅黑',   # 设置字体名称
    'bg_color': 'orange'     # 设置单元格背景颜色为橙色
    })
worksheet.write('A1', 789.23, currency_format)

workbook.close()

可能你经常会用Pandas导出Excel,但Pandas对Excel的处理能力很有限,所以可以使用XlsxWriter作为引擎,导出格式更加丰富、有图表的Excel。

使用方法很简单

复制代码
import pandas as pd

# 创建df数据
df = pd.DataFrame({'Data': [10, 20, 30, 20, 15, 30, 45]})

# 使用XlsxWriter作为引擎,创建excel写入对象
writer = pd.ExcelWriter('pandas_simple.xlsx', engine='xlsxwriter')

# 导出excel
df.to_excel(writer, sheet_name='Sheet1')

# 对excel对象进行各种操作
workbook = writer.book
worksheet = writer.sheets['Sales Data']
......

writer.close()

比如我用pandas处理一份上百万行的销售数据,最终输出时,使用XlsxWriter设计一份报表,有表有图,可以直接作为业务表使用。

因为XlsxWriter是将数据保存在内存中的,如果需要写入的数据量很大,连内存都扛不住了,XlsxWriter有专门的内存管理模式可以处理。

它的处理机制时,写入新的数据时,在内存中删除旧的数据,这样内存不会被一直占用,还能保证数据可以持续写入。

你可以在创建 Workbook 对象时设置constant_memory参数来启用内存管理模式

复制代码
workbook = xlsxwriter.Workbook('large_file.xlsx', 
{'constant_memory': True}) 

可以看到XlsxWriter非常的简单,但却很强大,搭配Pandas来用效果更好,最后放一个使用xlsxwriter做的商业化看板,一键导出,非常方便。

相关推荐
开开心心就好9 小时前
近200个工具的电脑故障修复合集
安全·智能手机·pdf·电脑·consul·memcache·1024程序员节
数据皮皮侠AI2 天前
中国城市可再生能源数据集(2005-2021)|顶刊 Sci Data 11 种能源面板
大数据·人工智能·笔记·能源·1024程序员节
计算机毕业论文辅导5 天前
物联网实战:基于MQTT协议的智能家居数据传输系统设计与实现
1024程序员节
开开心心就好5 天前
支持批量处理的视频分割工具推荐
安全·智能手机·rust·pdf·电脑·1024程序员节·lavarel
liuyao_xianhui7 天前
Linux开发工具结尾 _make
linux·运维·服务器·数据结构·哈希算法·宽度优先·1024程序员节
学传打活9 天前
【边打字.边学昆仑正义文化】_21_爱的结晶(1)
微信公众平台·1024程序员节·汉字·昆仑正义文化
数据皮皮侠AI16 天前
顶刊同款!中国地级市风灾风险与损失数据集(2000-2022)|灾害 / 环境 / 经济研究必备
大数据·人工智能·笔记·能源·1024程序员节
Fab1an17 天前
Busqueda——Hack The Box 靶机
linux·服务器·学习·1024程序员节
技术专家18 天前
Stable Diffusion系列的详细讨论 / Detailed Discussion of the Stable Diffusion Series
人工智能·python·算法·推荐算法·1024程序员节
学传打活20 天前
古代汉语是源,现代汉语是流,源与流一脉相承。
微信公众平台·1024程序员节·汉字·中华文化