python自动化办公实例(使用openpyxl、os处理统计Excel表中的数据并将其合并)

源数据格式

以其中一个表格为例

可以看到表中数据比较杂乱且并没有我们想要的数据、指标(如一等奖、二等奖的数量)不利于下一步数据的分析。所以我们需要手动对数据进行一些处理,大致格式如下:

数据处理格式

这里的手动处理可以通过优化我们的代码来进行一些简化以减少我们的工作量(如其他列不用删只要把奖项这里的列名进行统一就好了、文件名其实也可以不用进行重命名可以直接用我们之前的名字这样不仅可以减少工作量又可以让表的名字更加清晰且有辨识度)不过由于本人之前并未接触过python相关库的使用所以代码写完之后才意识到这些问题。以后有时间再把代码优化优化......

数据处理好存储在一个文件目录下就可以开始运行我们的代码了

代码

python 复制代码
import openpyxl
import os
'''
    1、使用代码前请检查表格格式
    2、请安装相应的库(openpyxl、os、pandas)
    3、代码运行前需关闭打开的需要处理的文件
    4、本人水平有限,如果一直报错请上CSDN........
'''
dizhi1=input("请输入原数据存储的路径:")
dizhi2=input("请输入数据处理后存储的路径:")
# 当前目录
base_dir = dizhi1
# 获取当前目录下的所有文件
# 遍历文件列表,输出文件名
#获取绝对路径        files = [os.path.join(base_dir, file) for file in os.listdir(r"{}".format(base_dir))]

for file in os.listdir(r"{}".format(base_dir)):
    print(file)
    # 获取工作簿对象
    wb = openpyxl.load_workbook(r'{}/{}'.format(dizhi1,file))
    wb2=openpyxl.load_workbook('湖南省本科院校清单.xlsx')
    # 获取所有工作表名称
    print(wb.sheetnames)
    # 获取工作表对象
    sheet1 = wb.worksheets[0]
    sheet_2 = wb2.worksheets[0]
    # 设置Sheet名称
    sheet1.title = '竞赛成绩'
    # 创建一个新sheet,可以指定名称,index表示新创建的工作簿放在第几个位置, index从0开始计数
    sheet2 = wb.create_sheet(index=1, title='竞赛成绩统计及汇总')
    # 获取所有工作表名称
    print(wb.sheetnames)
    #获取名单
    b=[]#名单
    # 获取工作表总行数
    rows_2 = sheet_2.max_row
    # 获取工作表总列数
    cols_2 = sheet_2.max_column
    # 总行,总列
    print(rows_2, cols_2)
    for i in range(2, rows_2):
        cell_value = sheet_2.cell(row=i, column=1).value
        b.append(cell_value)
    print(b)
    #给表二的列命名
    sheet2['A1'] = '学校'
    sheet2['B1'] = '一等奖'
    sheet2['C1'] = '二等奖'
    sheet2['D1'] = '三等奖'
    sheet2['E1'] = '获奖总数'
    sheet2['F1'] = '排名'
    sheet2['G1'] = '排名指标'
    sheet2['H1'] = '综合竞赛指标'

    # 获取所有工作表名称
    print(wb.sheetnames)
    # 获取工作表总行数
    rows = sheet1.max_row
    # 获取工作表总列数
    cols = sheet1.max_column
    # 总行,总列
    print(rows, cols)
    # 读取所有内容
    zs=0#获奖总数
    no1=0#一等奖
    no2=0#二等奖
    no3=0#三等奖
    mz=[]
    a=[]#初始表
    x=[]#最终表
    for i in range(1, rows+1):
        row_list = []
        for j in range(1, cols+1):
            cell_value = sheet1.cell(row=i, column=j).value
            row_list.append(cell_value)
        a.append(row_list)
    for i in range(1, rows):
        name=a[i][0]
        if(name not in mz and name in b):
            zs=0
            no1=0
            no2=0
            no3=0
            zhzb=0
            mz.append(name)
            for j in range(1, rows):
                if a[j][0] == name:
                    zs = zs + 1
                    if a[j][1] == '一等奖' or a[j][1] == '一等':
                        no1 = no1 + 1
                    if a[j][1] == '二等奖' or a[j][1] == '二等':
                        no2 = no2 + 1
                    if a[j][1] == '三等奖' or a[j][1] == '三等':
                        no3 = no3 + 1
            print(name,zs, no1, no2, no3)
            # 竞赛综合指标依据2021年度吉首大学教学奖励办法,按照导向性、重点性、示范性原则制定
            zhzb = no1 * 0.5 + no2 * 0.2 + no3 * 0.1
            # 写入多个单元格(追加模式,不会覆盖之前的,从有数据的下一行开始)
            #sheet2.append([name,no1,no2,no3,zs,None,None,zhzb])
            x.append([name,no1,no2,no3,zs,None,None,zhzb])
    x.sort(key=lambda x: (x[1], x[2], x[3]),reverse=True)
    n=len(x)
    s=100
    pm=1
    t=x[0][1:4]
    for i in range(n):
        #print(t[1],x[i][1]);
        if(x[i][1:4] != t):
            pm=i+1
            print(pm)
        x[i][5]=pm
        x[i][6]=round(s-(pm-1)*(100/n),2)
        sheet2.append(x[i])
        t=x[i][1:4]
    # 保存
    print(x)
    wb.save(r"{}\{}".format(dizhi2,file))

注释全写在代码里了哦

数据处理后的格式

将处理汇总好的数据放在了另一个表里

附录

湖南省本科院校清单

我直接把这个表放在了python文件的同一目录下以便调用

相关推荐
好看资源平台11 分钟前
网络爬虫——综合实战项目:多平台房源信息采集与分析系统
爬虫·python
一棵开花的树,枝芽无限靠近你14 分钟前
【PPTist】添加PPT模版
前端·学习·编辑器·html
进击的六角龙32 分钟前
深入浅出:使用Python调用API实现智能天气预报
开发语言·python
檀越剑指大厂32 分钟前
【Python系列】浅析 Python 中的字典更新与应用场景
开发语言·python
VertexGeek33 分钟前
Rust学习(八):异常处理和宏编程:
学习·算法·rust
湫ccc40 分钟前
Python简介以及解释器安装(保姆级教学)
开发语言·python
孤独且没人爱的纸鹤43 分钟前
【深度学习】:从人工神经网络的基础原理到循环神经网络的先进技术,跨越智能算法的关键发展阶段及其未来趋势,探索技术进步与应用挑战
人工智能·python·深度学习·机器学习·ai
羊小猪~~1 小时前
tensorflow案例7--数据增强与测试集, 训练集, 验证集的构建
人工智能·python·深度学习·机器学习·cnn·tensorflow·neo4j
lzhlizihang1 小时前
python如何使用spark操作hive
hive·python·spark
q0_0p1 小时前
牛客小白月赛105 (Python题解) A~E
python·牛客