Python读取Excel文件中指定的列数并生成CSV文件

0x00 安装Pandas和OpenPyXL

python 复制代码
pip install pandas

pip install openpyxl

0x01 Encoding

python 复制代码
import os
import pandas as pd
import openpyxl
from openpyxl import load_workbook
import csv


def write_dict_to_csv(dict_data, fileName):
    df = pd.DataFrame.from_dict(dict_data)
    # 将DataFrame写入CSV文件
    df.to_csv(fileName, index=False)


def writeCSV(dict_data, fileName):
    # 打开CSV文件
    with open(fileName, 'w', newline='') as file:
        writer = csv.writer(file)

        # writer.writerow(["key", "value"])
        print("====================================")

        # 工况点字典
        msgPoints_dict = {}
        msgPoints_num = 51

        # 遍历字典
        for key, value in dict_data.items():
            print(value)
            # writer.writerow(value)
            if isinstance(value, list):
                for item in value:
                    # 若表格数据为空则过滤掉
                    if isinstance(item, str) and item.startswith('EP') and item is not None:
                        msgPoints_dict[msgPoints_num] = value
                        # writer.writerow(value)
                        msgPoints_num = msgPoints_num + 1

        print("msgPoints_dict_size: " + str(len(msgPoints_dict)))

        for key, value in msgPoints_dict.items():
            print(key, value, end="\n")
            # 检查键值是否以"EP"开头
            if isinstance(value, list) and value and isinstance(value[2], str) and value[2].startswith("EP"):
                # print(value)

                tmp_list = [str(key)]
                tmp_list.extend(value)
                # 写入CSV文件
                # writer.writerow([key, item])
                writer.writerow(tmp_list)

    pass


def main():
    print("=== Read Excel ===")
    fileName = './doc/data.xlsx'

    # 字典类型
    dict_data = {}
    if os.path.exists(fileName):
        # 当前活跃的Sheel页
        wb = load_workbook(fileName)
        print(wb.active)

        shell = wb.active
        # print(ws['B7'].value)
        # print(ws.cell(7, 2).value)
        # rows = ws.rows
        # print(rows)

        columns_to_print = ['B', 'F', 'O']
        index = 1
        for row in shell.iter_rows():
            tmp_list = []
            for col_idx, cell in enumerate(row, start=1):
                column_letter = openpyxl.utils.get_column_letter(col_idx)
                if column_letter in columns_to_print:
                    tmp_list.append(cell.value)
                    # print(cell.value)

            dict_data[index] = tmp_list
            index = index + 1

    writeCSV(dict_data, "output.csv")
    # write_dict_to_csv(dict_data, "msg_points.csv")
    pass


if __name__ == "__main__":
    main()
相关推荐
陈苏同学14 分钟前
4. 将pycharm本地项目同步到(Linux)服务器上——深度学习·科研实践·从0到1
linux·服务器·ide·人工智能·python·深度学习·pycharm
唐家小妹18 分钟前
介绍一款开源的 Modern GUI PySide6 / PyQt6的使用
python·pyqt
XKSYA(小巢校长)1 小时前
NatGo我的世界联机篇
开发语言·php
羊小猪~~1 小时前
深度学习项目----用LSTM模型预测股价(包含LSTM网络简介,代码数据均可下载)
pytorch·python·rnn·深度学习·机器学习·数据分析·lstm
Cons.W1 小时前
Codeforces Round 975 (Div. 1) C. Tree Pruning
c语言·开发语言·剪枝
憧憬成为原神糕手1 小时前
c++_ 多态
开发语言·c++
VBA63371 小时前
VBA信息获取与处理第三个专题第三节:工作薄在空闲后自动关闭
开发语言
Marst Code1 小时前
(Django)初步使用
后端·python·django
985小水博一枚呀1 小时前
【对于Python爬虫的理解】数据挖掘、信息聚合、价格监控、新闻爬取等,附代码。
爬虫·python·深度学习·数据挖掘
立秋67892 小时前
Python的defaultdict详解
服务器·windows·python