python+excel自动化办公

前言

一、python对excel的基础使用操作

[1.1 读取excel文件](#1.1 读取excel文件)

[1.2 写入学生数据信息](#1.2 写入学生数据信息)

[3.1 制作员工的工资信息](#3.1 制作员工的工资信息)

[3.2 员工信息管理gui](#3.2 员工信息管理gui)

四、自动化财务数据分析预测

4.1制作数据

参考文献

前言

python自动化办公将主要研究如何通过python代码读取excel文件的形式实现在实际生活中应用，本文属于分享博文，涉及深度比较浅。

首先安装包

复制代码

pip install pandas -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple

一、python对excel的基础使用操作

1.1 读取excel文件

python 复制代码

import pandas as pd
# 读取 Excel 文件中的第一个工作表
df = pd.read_excel('一万条学生成绩数据.xlsx')
# 显示前几行数据
print(df.head())

1.2 写入学生数据信息

python 复制代码

import pandas as pd
# Step 1: 读取 Excel 文件
# 假设有一个文件 'example.xlsx'，我们读取它
df = pd.read_excel('一万条学生成绩数据.xlsx')
# 打印原始数据以供参考
print("Original Data:")
print(df)
# Step 2: 添加一行新数据
# 创建一个新行，列名需要与现有的列名保持一致
new_row = {'Column1': 'New Data 1', 'Column2': 'New Data 2', 'Column3': 'New Data 3'}
# 将新行转换为 DataFrame 格式
new_row_df = pd.DataFrame([new_row])
# 使用 pd.concat 方法将新行添加到原始数据框中
df = pd.concat([df, new_row_df], ignore_index=True)
# 打印添加新行后的数据
print("\nData After Adding New Row:")
print(df)

# Step 3: 将包含新行的数据写入到新的 Excel 文件中
# 将数据框写入新的 Excel 文件
df.to_excel('example_with_new_row.xlsx', index=False)

print("\nNew Excel file 'example_with_new_row.xlsx' saved with the new row.")

二、自动生成录取通知书

2.1生成十万条假数据

python 复制代码

import random
import pandas as pd
from faker import Faker
# 初始化 Faker
fake = Faker('zh_CN')  # 使用中文
# 定义一些大学和专业
universities = [
    '清华大学', '北京大学', '浙江大学', '复旦大学', '上海交通大学',
    '中国科学技术大学', '南京大学', '武汉大学', '华中科技大学', '中山大学'
]
majors = [
    '计算机科学与技术', '电子信息工程', '机械工程', '金融学', '临床医学',
    '法学', '建筑学', '化学工程与工艺', '生物工程', '国际经济与贸易'
]
# 生成成绩的函数
def generate_score(min_score=50, max_score=100):
    return random.randint(min_score, max_score)

# 生成祝愿语的函数
def generate_wish_message(university, principal_name):
    return f"祝贺您被 {university} 录取，愿您在校长 {principal_name} 的带领下，在大学的学习和生活中一帆风顺，前程似锦！"
# 生成假数据
def generate_data(num_records):
    data = []
    for i in range(num_records):
        student_name = fake.name()  # 生成中文姓名
        exam_id = f"EX{i+1:06d}"  # 考号，格式化为 6 位数，如 EX000001
        chinese_score = generate_score()
        math_score = generate_score()
        english_score = generate_score()
        science_score = generate_score()
        # 总分 = 语文 + 数学 + 英语 + 科学
        total_score = chinese_score + math_score + english_score + science_score
        # 随机选择一个大学和专业
        university = random.choice(universities)
        major = random.choice(majors)
        # 生成校长姓名
        principal_name = fake.name()
        # 生成祝愿语
        wish_message = generate_wish_message(university, principal_name)
        data.append({
            '姓名': student_name,
            '考号': exam_id,
            '语文成绩': chinese_score,
            '数学成绩': math_score,
            '英语成绩': english_score,
            '科学成绩': science_score,
            '总分': total_score,
            '录取大学': university,
            '录取专业': major,
            '校长姓名': principal_name,
            '祝愿语': wish_message
        })
    return data
# 生成 10 万条数据
num_records = 100000
data = generate_data(num_records)
# 转换为 DataFrame
df = pd.DataFrame(data)
# 写入 Excel 文件
df.to_excel('十万条学生成绩数据_带录取信息.xlsx', index=False)
print(f"已成功生成 {num_records} 条学生成绩数据（包含录取信息和祝愿语），并写入到 Excel 文件中。")

2.2制作录取通知书

安装包

python 复制代码

pip install pandas python-docx -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple

python 复制代码

import pandas as pd
from docx import Document
from docx.shared import Pt
from docx.enum.text import WD_ALIGN_PARAGRAPH
# 读取Excel文件
df = pd.read_excel('十万条学生成绩数据_带录取信息.xlsx')
# 创建一个Word文档对象
doc = Document()
# 设置录取通知书模板
def create_admission_letter(doc, name, exam_id, university, major, principal, wish_message):
    # 添加标题
    title = doc.add_heading(f'{university} 录取通知书', level=1)
    title.alignment = WD_ALIGN_PARAGRAPH.CENTER
    # 添加学生姓名和考号
    doc.add_paragraph(f"尊敬的 {name} 同学：")
    doc.add_paragraph(f"考号：{exam_id}")

    # 添加录取信息
    doc.add_paragraph(f"恭喜您被 {university} {major} 专业录取！")

    # 添加校长祝福语
    doc.add_paragraph(f"校长：{principal}")
    doc.add_paragraph(wish_message)

    # 添加分隔符，每个录取通知书一页
    doc.add_page_break()


# 遍历每位学生的记录，生成录取通知书
for idx, row in df.iterrows():
    create_admission_letter(
        doc,
        row['姓名'],
        row['考号'],
        row['录取大学'],
        row['录取专业'],
        row['校长姓名'],
        row['祝愿语']
    )
# 保存Word文档
doc.save('录取通知书合集.docx')
print("所有学生的录取通知书已生成！")

三、员工工资信息管理操作

3.1 制作员工的工资信息

python 复制代码

import random
import pandas as pd
from faker import Faker
# 初始化 Faker
fake = Faker('zh_CN')  # 使用中文
# 定义假数据生成函数
def generate_salary_data(num_employees, year):
    data = []
    months = [f"{year}-{str(month).zfill(2)}" for month in range(1, 13)]  # 生成每个月份，如 2024-01, 2024-02
    employee_ids = [f"EMP{str(i).zfill(4)}" for i in range(1, num_employees + 1)]  # 工号，如 EMP0001, EMP0002
    for employee_id in employee_ids:
        employee_name = fake.name()  # 生成中文姓名
        for month in months:
            salary = random.randint(5000, 15000)  # 假设工资在 5000 到 15000 之间
            bonus = random.randint(1000, 5000)  # 假设绩效在 1000 到 5000 之间
            total_payment = salary + bonus  # 实际发放为工资加绩效

            data.append({
                '姓名': employee_name,
                '工号': employee_id,
                '月份': month,
                '工资': salary,
                '绩效': bonus,
                '实际发放': total_payment
            })
    return data
# 生成 100 名员工的 2024 年工资信息
num_employees = 100
year = 2024
salary_data = generate_salary_data(num_employees, year)
# 转换为 DataFrame
df = pd.DataFrame(salary_data)
# 写入 Excel 文件
df.to_excel('员工2024年工资信息.xlsx', index=False)
print(f"已成功生成 {num_employees * 12} 条员工工资信息，并写入到 Excel 文件中。")

3.2 员工信息管理gui

python 复制代码

import pandas as pd
import tkinter as tk
from tkinter import ttk
from tkinter import messagebox
import matplotlib.pyplot as plt
import matplotlib
matplotlib.use('TkAgg')          # 设置后端为交互式的 TkAgg
plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False    # 解决负号 '-' 显示为方块的问题

# 读取 Excel 数据
file_path = '员工2024年工资信息.xlsx'
df = pd.read_excel(file_path)

# 创建主窗口
root = tk.Tk()
root.title("员工工资信息系统")

# 创建标签和输入框
label1 = tk.Label(root, text="查看所有员工信息:")
label1.pack()

# 创建表格以显示员工信息
tree = ttk.Treeview(root, columns=("姓名", "工号", "月份", "工资", "绩效", "实际发放"), show='headings')
tree.heading("姓名", text="姓名")
tree.heading("工号", text="工号")
tree.heading("月份", text="月份")
tree.heading("工资", text="工资")
tree.heading("绩效", text="绩效")
tree.heading("实际发放", text="实际发放")
tree.pack(fill=tk.BOTH, expand=True)

# 插入所有员工信息
for index, row in df.iterrows():
    tree.insert("", tk.END, values=list(row))

# 月份查询
def query_by_month():
    month = month_entry.get()
    if month:
        filtered_df = df[df['月份'] == month]
        if not filtered_df.empty:
            for item in tree.get_children():
                tree.delete(item)
            for index, row in filtered_df.iterrows():
                tree.insert("", tk.END, values=list(row))
        else:
            messagebox.showinfo("信息", "没有找到该月份的记录。")
    else:
        messagebox.showwarning("警告", "请输入月份。")

# 按员工姓名查询
def query_by_name():
    name = name_entry.get()
    if name:
        filtered_df = df[df['姓名'] == name]
        if not filtered_df.empty:
            for item in tree.get_children():
                tree.delete(item)
            for index, row in filtered_df.iterrows():
                tree.insert("", tk.END, values=list(row))
        else:
            messagebox.showinfo("信息", "没有找到该员工的记录。")
    else:
        messagebox.showwarning("警告", "请输入员工姓名。")

# 绘制图表
def draw_chart():
    name = name_entry.get()
    chart_type = chart_type_var.get()  # 获取选择的图表类型
    if name:
        filtered_df = df[df['姓名'] == name]
        if not filtered_df.empty:
            if chart_type == "折线图":
                plt.figure(figsize=(10, 5))
                plt.plot(filtered_df['月份'], filtered_df['实际发放'], marker='o', label='实际发放')
                plt.title(f"{name} 的工资信息")
                plt.xlabel("月份")
                plt.ylabel("实际发放")
                plt.xticks(rotation=45)
                plt.grid()
                plt.legend()
                plt.show()

            elif chart_type == "柱状图":
                plt.figure(figsize=(10, 5))
                plt.bar(filtered_df['月份'], filtered_df['实际发放'], color='skyblue', label='实际发放')
                plt.title(f"{name} 的工资信息")
                plt.xlabel("月份")
                plt.ylabel("实际发放")
                plt.xticks(rotation=45)
                plt.grid()
                plt.legend()
                plt.show()

            elif chart_type == "饼状图":
                plt.figure(figsize=(8, 8))
                plt.pie(filtered_df['实际发放'], labels=filtered_df['月份'], autopct='%1.1f%%')
                plt.title(f"{name} 的工资信息")
                plt.show()
        else:
            messagebox.showinfo("信息", "没有找到该员工的记录。")
    else:
        messagebox.showwarning("警告", "请输入员工姓名。")

# 月份查询输入框
month_label = tk.Label(root, text="输入月份（格式: 2024-01）：")
month_label.pack()
month_entry = tk.Entry(root)
month_entry.pack()

month_button = tk.Button(root, text="查询该月份工资信息", command=query_by_month)
month_button.pack()

# 姓名查询输入框
name_label = tk.Label(root, text="输入员工姓名：")
name_label.pack()
name_entry = tk.Entry(root)
name_entry.pack()

name_button = tk.Button(root, text="查询该员工工资信息", command=query_by_name)
name_button.pack()

# 选择图表类型
chart_type_var = tk.StringVar()
chart_type_label = tk.Label(root, text="选择图表类型：")
chart_type_label.pack()
chart_type_dropdown = ttk.Combobox(root, textvariable=chart_type_var)
chart_type_dropdown['values'] = ("折线图", "柱状图", "饼状图")
chart_type_dropdown.current(0)  # 设置默认值
chart_type_dropdown.pack()

chart_button = tk.Button(root, text="绘制图表", command=draw_chart)
chart_button.pack()

# 启动主循环
root.mainloop()

四、自动化财务数据分析预测

自动化数据分析可以帮助公司了解业务趋势、优化成本和做出数据驱动的决策： BI工具：如 Power BI、Tableau 可与会计系统集成，生成可视化的财务分析报告。 Python数据分析：使用 pandas 结合 matplotlib、seaborn 对财务数据进行分析，发现趋势和异常。机器学习预测：通过历史数据，使用机器学习模型进行财务预测和成本估算。案例：某企业使用 Power BI 将财务数据可视化，每月自动生成分析报告，管理层可以实时了解成本和利润情况，帮助制定预算。这个我们可以进一步探讨一下。

4.1制作数据

假数据应包含的字段

员工信息
- 姓名：员工的名字
- 工号：唯一标识员工的工号
- 部门：员工所在的部门（例如：销售部、技术部等）
- 职位：员工的职位（例如：经理、助理等）
- 工资调整记录：员工工资调整的历史记录，包括调薪日期和调整幅度
工资信息
- 年份：2024年
- 月份：1到12
- 基本工资：员工的基本工资
- 绩效工资：基于员工表现的绩效工资
- 实际发放工资：基本工资和绩效工资的总和
财务指标
- 公司收入：当月公司总收入
- 公司支出：当月公司总支出
- 利润：公司收入减去支出
- 成本：公司运营的成本

代码如下:

python 复制代码

import pandas as pd
import random
from datetime import datetime, timedelta

# 设置随机种子以便于重现
random.seed(42)

# 员工数量和基本工资范围
num_employees = 100
base_salary_range = (3000, 10000)  # 基本工资范围

# 创建员工信息
names = [f'员工{i}' for i in range(1, num_employees + 1)]
employee_ids = [f'E{str(i).zfill(3)}' for i in range(1, num_employees + 1)]
departments = ['销售部', '技术部', '人事部', '财务部', '市场部']
positions = ['经理', '助理', '专员', '主管', '总监']

# 生成工资信息
data = []
for employee_id, name in zip(employee_ids, names):
    for month in range(1, 13):
        # 随机生成基本工资和绩效工资
        basic_salary = random.randint(*base_salary_range)
        performance_bonus = random.randint(0, 2000)  # 绩效工资范围
        actual_salary = basic_salary + performance_bonus

        # 财务指标
        company_income = random.randint(50000, 200000)  # 公司收入范围
        company_expense = random.randint(30000, 150000)  # 公司支出范围
        profit = company_income - company_expense
        cost = random.randint(10000, 50000)  # 成本范围

        # 随机生成部门和职位
        department = random.choice(departments)
        position = random.choice(positions)

        # 添加调薪记录
        if month == 6:  # 假设在6月进行调薪
            adjustment_date = datetime(2024, 6, 15).date()
            adjustment_amount = random.randint(500, 2000)  # 调薪幅度
            adjustment_record = f"调薪日期: {adjustment_date}, 调整幅度: {adjustment_amount}"
        else:
            adjustment_record = None

        # 收集数据
        data.append({
            '姓名': name,
            '工号': employee_id,
            '年份': 2024,
            '月份': month,
            '基本工资': basic_salary,
            '绩效工资': performance_bonus,
            '实际发放工资': actual_salary,
            '公司收入': company_income,
            '公司支出': company_expense,
            '利润': profit,
            '成本': cost,
            '部门': department,
            '职位': position,
            '工资调整记录': adjustment_record
        })

# 创建 DataFrame
df = pd.DataFrame(data)

# 将数据写入 Excel 文件
df.to_excel('2024年员工工资和财务指标数据.xlsx', index=False)

print("假数据生成完成，已保存到 '2024年员工工资和财务指标数据.xlsx'。")

为了从会计的角度进行财务数据分析，包括生成每月的财务报表和风险预测，我们可以遵循以下步骤：

数据准备与清洗

确保数据质量是财务分析的第一步。通过以下步骤准备和清洗数据：

检查缺失值和异常值：识别并处理缺失值或极端值。
格式化日期：确保日期字段的格式一致，方便进行时间序列分析。

生成每月财务报表

每月财务报表通常包括收入、支出、利润等关键指标。以下是生成财务报表的步骤：

按月份聚合数据 ：使用 pandas 对数据进行聚合，计算每月的总收入、总支出和总利润。
创建财务报表：将聚合结果存储到新的 DataFrame 或 Excel 文件中。

以下是示例代码：

python 复制代码

import pandas as pd

# 读取生成的数据
df = pd.read_excel('2024年员工工资和财务指标数据.xlsx')

# 按月份聚合数据
monthly_report = df.groupby(['年份', '月份']).agg(
    总收入=('公司收入', 'sum'),
    总支出=('公司支出', 'sum'),
    总利润=('利润', 'sum'),
    总成本=('成本', 'sum')
).reset_index()

# 将财务报表保存到 Excel
monthly_report.to_excel('2024年每月财务报表.xlsx', index=False)

print("每月财务报表生成完成，已保存到 '2024年每月财务报表.xlsx'。")

财务指标分析

根据生成的每月财务报表，可以进行以下分析：

收入与支出趋势分析：绘制时间序列图，观察收入和支出的变化趋势。
利润分析：计算每月的利润率（利润/收入），并绘制利润率变化趋势图。

以下是示例代码，展示如何进行趋势分析：

python 复制代码

import matplotlib.pyplot as plt

# 绘制收入、支出和利润的趋势图
plt.figure(figsize=(12, 6))
plt.plot(monthly_report['月份'], monthly_report['总收入'], label='总收入', marker='o')
plt.plot(monthly_report['月份'], monthly_report['总支出'], label='总支出', marker='o')
plt.plot(monthly_report['月份'], monthly_report['总利润'], label='总利润', marker='o')
plt.title('2024年每月财务指标趋势')
plt.xlabel('月份')
plt.ylabel('金额')
plt.xticks(monthly_report['月份'])
plt.legend()
plt.grid()
plt.savefig('2024年每月财务指标趋势.png')  # 保存图像
plt.show()

风险预测分析

风险预测可以通过多种方式进行，以下是一些常用方法：

时间序列分析：使用时间序列模型（如 ARIMA）预测未来的收入和支出。
机器学习模型：使用历史数据构建模型，预测未来的财务指标，识别潜在的风险。

以下是使用 statsmodels 库进行简单时间序列预测的示例代码：

python 复制代码

from statsmodels.tsa.arima.model import ARIMA

# 设置月份为索引
monthly_report.set_index(['年份', '月份'], inplace=True)

# 使用 ARIMA 模型预测下一月的收入
model = ARIMA(monthly_report['总收入'], order=(1, 1, 1))
model_fit = model.fit()
forecast = model_fit.forecast(steps=1)  # 预测下一个月的收入

print(f"预计下个月的总收入为：{forecast[0]:.2f}")

总体代码展示

python 复制代码

import pandas as pd
import matplotlib.pyplot as plt
import matplotlib
from statsmodels.tsa.arima.model import ARIMA

matplotlib.use('TkAgg')  # 设置后端为交互式的 TkAgg
plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False  # 解决负号 '-' 显示为方块的问题

# 读取生成的数据
df = pd.read_excel('2024年员工工资和财务指标数据.xlsx')

# 按月份聚合数据
monthly_report = df.groupby(['年份', '月份']).agg(
    总收入=('公司收入', 'sum'),
    总支出=('公司支出', 'sum'),
    总利润=('利润', 'sum'),
    总成本=('成本', 'sum')
).reset_index()

# 将财务报表保存到 Excel
monthly_report.to_excel('2024年每月财务报表.xlsx', index=False)

print("每月财务报表生成完成，已保存到 '2024年每月财务报表.xlsx'。")

# 绘制收入、支出和利润的趋势图
plt.figure(figsize=(12, 6))
plt.plot(monthly_report['月份'], monthly_report['总收入'], label='总收入', marker='o')
plt.plot(monthly_report['月份'], monthly_report['总支出'], label='总支出', marker='o')
plt.plot(monthly_report['月份'], monthly_report['总利润'], label='总利润', marker='o')
plt.title('2024年每月财务指标趋势')
plt.xlabel('月份')
plt.ylabel('金额')
plt.xticks(monthly_report['月份'])
plt.legend()
plt.grid()
plt.savefig('2024年每月财务指标趋势.png')  # 保存图像
plt.show()

# 设置月份为索引
monthly_report.set_index(['年份', '月份'], inplace=True)

# 使用 ARIMA 模型预测下一月的收入
model = ARIMA(monthly_report['总收入'], order=(1, 1, 1))
model_fit = model.fit()

# 预测下一个月的收入
forecast = model_fit.forecast(steps=1)

# 输出预测结果
if isinstance(forecast, pd.Series):
    print(f"预计下个月的总收入为：{forecast.values[0]:.2f}")  # 访问预测值
else:
    print(f"预计下个月的总收入为：{forecast[0]:.2f}")  # 对于其他类型