要批量合并多个Excel文件,可以按照以下步骤进行操作:
- 导入所需的Python库:首先,您需要导入`pandas`库来处理Excel文件。
import pandas as pd
- 定义文件路径和输出文件名称:
input_folder = "your_input_folder_path"
output_file = "your_output_file_path.xlsx"
- 创建一个空的DataFrame来存储合并后的数据:
merged_data = pd.DataFrame()
- 循环遍历文件夹中的Excel文件并合并数据:
import os
for filename in os.listdir(input_folder):
if filename.endswith(".xlsx"):
file_path = os.path.join(input_folder, filename)
读取Excel文件数据
data = pd.read_excel(file_path)
将数据添加到合并的DataFrame中
merged_data = merged_data.append(data, ignore_index=True)
请确保将代码中的`your_input_folder_path`替换为您实际的输入文件夹路径,并将`your_output_file_path.xlsx`替换为您希望保存合并后文件的输出路径和文件名。
代码将循环遍历文件夹中的每个Excel文件,读取数据并将其添加到一个空的DataFrame中。通过设置`ignore_index=True`来保持合并后的数据的连续索引。
- 将合并后的数据保存为新的Excel文件:
merged_data.to_excel(output_file, index=False)
代码会将合并后的数据保存为指定的输出文件。
请注意,以上代码假设要合并的所有Excel文件具有相同的表头和列结构。如果不是,可能需要进行额外的处理和调整以确保数据合并的准确性。