data文件夹内,有多个xls文件。每个xls文件格式一致, 表头占两行,表位汇总数据占一行。
表头两行,拼接前第二行设置为表头,且删除第二行。
在python读入的dataframe中,成本表是表头,第一行是线路。在dataframe里面设置第0行(线路)为表头之后,删除第0行(线路)。
表尾一行,拼接前删除。
import pandas as pd
import os
"连接文件夹内多个xls表格"
data_list = []
path = "./"
data_dir = os.path.join(path, 'yy_data')
for filename in os.listdir(data_dir):
name_dir = os.path.join(data_dir, filename)
// print(filename.split(".")[-1])
if filename.endswith((".xls","xlsx")):
df = pd.read_excel(name_dir)
df.drop([len(df) - 1], inplace=True) # 删除最后一行
c_list = df.values.tolist()[0] # 得到想要设置为列索引【表头】的某一行提取出来
df.columns = c_list # 设置列索引【表头】
df.drop(index=[0], inplace=True) #删除设置为表头的 第一行
data_list.append(df)
# concat合并Pandas数据
data_all =pd.concat(data_list)
# 将 DataFrame 保存为 excel 文件
data_all.to_excel("总和.xlsx",index=False)
# 查看 DataFrame 的行数和列数。
rows = data_all.shape
print("查看行数与列数:", rows)
print("恭喜你,合并完成!")
文件夹内 文件重命名
def rename(path):
data_dir = os.path.join(path, 'data')
# 创建文件夹
xls_path = 'xls_data'
if not os.path.exists(xls_path):
os.makedirs(xls_path)
for f in os.listdir(data_dir):
name_dir = os.path.join(data_dir, f)
if f.split(".")[-1] != 'xls':
new_name = os.path.join(xls_path, f+ '.xls')
# new_name = f + '.xls'
shutil.copyfile(name_dir, new_name)
print("重命名完毕")