Python 操作 Excel 表格从简单到高级用法

Python 操作 Excel 表格主要通过几个流行的库来实现,包括 pandas、openpyxl 和 xlsxwriter。下面是使用这些库进行常见操作的一些示例代码片段。

#一、简单操作

使用 pandas

python 复制代码
#读取 Excel 文件 
import pandas as pd

# 读取整个Excel文件
df = pd.read_excel('example.xlsx')

# 读取特定工作表
df = pd.read_excel('example.xlsx', sheet_name='Sheet1')
 
2.  写入 Excel 文件 
# 将 DataFrame 写入新的 Excel 文件
df.to_excel('output.xlsx', index=False)

# 写入指定工作表
with pd.ExcelWriter('output.xlsx') as writer:
    df.to_excel(writer, sheet_name='New Sheet', index=False)

使用 openpyxl

python 复制代码
1.  安装 openpyxl 
pip install openpyxl
 
2.  读取单元格数据 
from openpyxl import load_workbook

wb = load_workbook('example.xlsx')
ws = wb['Sheet1']
cell_value = ws['A1'].value
print(cell_value)
 
3.  写入单元格数据 
from openpyxl import Workbook

wb = Workbook()
ws = wb.active
ws['A1'] = 'Hello'
ws['B1'] = 'World!'

wb.save('output.xlsx')

使用 xlsxwriter

python 复制代码
1.  安装 xlsxwriter 
pip install XlsxWriter
 
2.  创建新工作簿并写入数据 
import xlsxwriter

workbook = xlsxwriter.Workbook('output.xlsx')
worksheet = workbook.add_worksheet()

worksheet.write('A1', 'Hello')
worksheet.write('B1', 'World!')

workbook.close()

二、高级用法

当然,Python 操作 Excel 时,除了基础的读写操作外,还有许多高级玩法可以提升工作效率和数据处理能力。下面通过几个例子来展示如何利用 pandas 和 openpyxl 库进行更复杂的数据处理和格式化。

使用 pandas 进行高级数据处理

python 复制代码
1.  数据透视表(Pivot Table) 
import pandas as pd

# 假设df是从Excel读取的数据
df = pd.read_excel('sales_data.xlsx')

# 创建数据透视表
pivot_table = pd.pivot_table(df, values='Sales', index=['Manager'], columns=['Product'],
                             aggfunc=np.sum, fill_value=0)

# 输出到新的Excel文件
pivot_table.to_excel('pivot_sales.xlsx')
 
2.  数据清洗与转换(Data Cleaning and Transformation) 
# 去除空值
df_cleaned = df.dropna()

# 替换特定值
df_cleaned['Status'] = df_cleaned['Status'].replace({'inactive': 'Inactive'})

# 重命名列
df_cleaned.rename(columns={'OldName': 'NewName'}, inplace=True)

使用 openpyxl 进行高级格式化

python 复制代码
1.  条件格式(Conditional Formatting) 
from openpyxl import Workbook
from openpyxl.styles import PatternFill
from openpyxl.formatting.rule import CellIsRule

# 创建工作簿和工作表
wb = Workbook()
ws = wb.active

# 填充数据
for i in range(1, 11):
    ws.cell(row=i, column=1).value = i * 10

# 定义填充样式
red_fill = PatternFill(start_color='FF0000', end_color='FF0000', fill_type='solid')

# 添加条件格式规则:如果A列的值大于50,则背景色为红色
rule = CellIsRule(operator='>', formula=['50'], fill=red_fill)
ws.conditional_formatting.add('A1:A10', rule)

# 保存文件
wb.save('conditional_format.xlsx')
 
2.  插入图表(Creating Charts) 
from openpyxl import Workbook
from openpyxl.chart import BarChart, Reference

# 假设已有数据
wb = Workbook()
ws = wb.active

# 添加数据
for i in range(1, 4):
    ws.cell(row=1, column=i+1).value = f'Series {i}'
    for j in range(1, 4):
        ws.cell(row=j+1, column=i+1).value = i * j

# 创建柱状图
chart = BarChart()
data = Reference(ws, min_col=2, min_row=1, max_col=4, max_row=4)
cats = Reference(ws, min_col=1, min_row=2, max_row=4)
chart.add_data(data, titles_from_data=True)
chart.set_categories(cats)
chart.title = "Sample Bar Chart"
ws.add_chart(chart, "E2")

# 保存文件
wb.save('chart_example.xlsx')

以上示例展示了如何使用 Python 对 Excel 进行复杂的数据分析、数据清洗、条件格式化以及图表插入等高级操作,这些技巧能极大提高数据处理的效率和质量。

相关推荐
跟着珅聪学java2 分钟前
在 Java 中处理 JSON 去除空 children数组,可以使用 Jackson 库。这里有几种实现方式
开发语言·windows·python
计算机安禾3 分钟前
【数据结构与算法】第33篇:交换排序(二):快速排序
c语言·开发语言·数据结构·数据库·算法·矩阵·排序算法
William Dawson4 分钟前
Java 后端高频 20 题超详细解析 ①
java·开发语言
lly2024066 分钟前
PHP 魔术常量
开发语言
Evand J7 分钟前
【MATLAB例程分享】三维非线性目标跟踪,观测为:距离+方位角+俯仰角,使用无迹卡尔曼滤波(UKF)与RTS平滑,高精度定位
开发语言·matlab·目标跟踪
编程之升级打怪12 分钟前
Java NIO的简单封装
java·开发语言·nio
Chase_______15 分钟前
【Python基础 | 第5章】面向对象与异常处理:一文搞懂类、对象、封装、继承、多态
开发语言·python
啦啦啦!15 分钟前
项目环境的搭建,项目的初步使用和deepseek的初步认识
开发语言·c++·人工智能·算法
YanDDDeat16 分钟前
【大模型微调】基于 Llama3-8B 的 LoRA 微调专有领域QA 问答对生成模型
python·语言模型·llama
小李云雾17 分钟前
Python Web 路由详解:核心知识点全覆盖
开发语言·前端·python·路由