Python 数据可视化进阶:精准插入图表到指定 Excel 工作表
在处理数据的过程中,我们常常需要将生成的图表精准地插入到已存在数据的 Excel 文件的指定工作表中。借助 Python 的强大库组合,这一操作得以高效实现。以下是经过优化和注释补充的代码,助你轻松完成这一任务。
python
from openpyxl import load_workbook
from openpyxl.drawing.image import Image
import matplotlib.pyplot as plt
import pandas as pd
def insert_sheet_to_chart_bar(filename, df, sheet_name):
"""
将柱状图插入到指定的 Excel 工作表中
参数:
filename -- Excel 文件路径
df -- 包含图表数据的 pandas DataFrame 对象
sheet_name -- 目标工作表名称
"""
# 提取数据:从 DataFrame 中获取列名和数据值
categories = list(df.columns) # 获取列名作为柱状图分类标签
values = list(df.values.flatten().tolist()) # 将数据展平并转换为列表形式
# 生成柱状图
plt.figure(figsize=(8, 4))
bars = plt.bar(categories, values, color=['#1f77b4', '#ff7f0e'])
# 设置中文显示:指定字体以确保中文标题和标签显示正确
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.title("会员数量对比") # 设置图表标题
plt.ylabel("数量") # 设置纵轴标签
# 添加数值标签:在每个柱子上方显示具体数值
for bar in bars:
height = bar.get_height()
plt.text(bar.get_x() + bar.get_width() / 2., height,
f'{int(height)}',
ha='center', va='bottom')
# 保存图表图片:将生成的图表保存为 PNG 格式
chart_path = 'membership_chart.png'
plt.savefig(chart_path, dpi=300, bbox_inches='tight')
plt.close()
# 读取 Excel 文件:加载已存在的 Excel 文件以便进行修改
wb = load_workbook(filename)
# 获取指定工作表:确保图表插入到正确的工作表中
if sheet_name in wb.sheetnames:
ws = wb[sheet_name]
else:
ws = wb.create_sheet(sheet_name) # 如果工作表不存在,则创建
# 插入图表图片:加载图表图片并调整大小,然后插入到指定位置
img = Image(chart_path)
img.width = 1000 # 设置图片宽度
img.height = 550 # 设置图片高度
ws.add_image(img, 'D2') # 将图片插入到 D2 单元格位置
# 保存修改后的 Excel 文件:确保所有更改被保存
wb.save(filename)
代码应用实例
假设有一个名为 data.xlsx
的 Excel 文件,其中包含一个名为 Sheet1
的工作表,该工作表中有两列数据(例如:A
列是月份,B
列是销售额)。我们可以通过以下代码将柱状图插入到 Sheet1
中:
python
# 导入 pandas 库
import pandas as pd
# 创建示例 DataFrame
data = {'月份': ['1月', '2月', '3月'], '销售额': [2500, 3200, 2800]}
df = pd.DataFrame(data)
# 直接读取指定sheet下的数据
# 指定要读取的工作表名称
sheet_name = 'Sheet1'
df = pd.read_excel('data.xlsx', sheet_name=sheet_name)
print(df)
# 调用函数
insert_sheet_to_chart_bar('data.xlsx', df, 'Sheet1')
关键点总结
- 精确指定工作表 :通过传递
sheet_name
参数,可以确保图表插入到正确的 Excel 工作表中。如果工作表不存在,代码会自动创建该工作表。 - 图表生成与保存 :使用
matplotlib
库生成柱状图,并保存为图片文件。在生成图表时,可以根据实际需求设置图表的标题、坐标轴标签、颜色、数值标签等属性。 - 图片插入与调整 :利用
openpyxl
库加载保存的图片,调整图片的宽度和高度,使其在 Excel 中显示时具有合适的大小,并将其插入到指定的单元格位置。 - 灵活性与可扩展性 :此代码结构清晰,易于根据具体需求进行修改和扩展。例如,可以轻松调整图表类型、样式,或者更改图片的插入位置和大小等。
希望以上内容能够帮助大家更好地理解和应用 Python 进行 Excel 数据可视化操作!