tolist()读取Excel列数据,(Excel列数据去重后,重新保存到新的Excel里)

从Excel列数据去重后,重新保存到新的Excel里

python 复制代码
import pandas as pd

# 读取Excel文件
file = r"D:\\pythonXangmu\\quchong\\quchong.xlsx"  # 使用原始字符串以避免转义字符
df = pd.read_excel(file, sheet_name='nameSheet')

# 删除重复值
df2 = df.drop_duplicates(subset='name')#列名 subset='name'

# 从Excel列中提取值
names = df2['name'].tolist()
ages = df2['age'].tolist()

# 创建一个新的DataFrame
df3 = pd.DataFrame({'name': names, 'age': ages})

# 将新的DataFrame写入Excel文件
#df3.to_excel('3quchong4.xlsx', sheet_name='Sheet1', index=False)#这里不是绝对路径,代码虽然跑成功了,也能打印出结果,但是电脑上就是找不到文件3quchong4.xlsx,解决办法就是写成绝对路径,就会自动生成一个3quchong4.xlsx文件
df3.to_excel('D:\\pythonXangmu\\quchong\\3quchong4.xlsx', sheet_name='Sheet1', index=False)
#df4 =df3.to_excel('D:\\pythonXangmu\\quchong\\3quchong4.xlsx', sheet_name='Sheet1', index=False)
# 读取新创建的Excel文件
df5 = pd.read_excel('3quchong4.xlsx', sheet_name='Sheet1')#这里读取数据,一定是pandas.read_excel,不是 某个Excel表.read_excel,如df4.read_excel
#如:df5= df4.read_excel('quchong2.xlsx', sheet_name='Sheet1')#Excel表.read_excel 是个错误的写法
print('去重后5\n', df5)

这里还会报错:handle = open(handle, ioargs.mode)

FileNotFoundError: [Errno 2] No such file or directory: '3quchong4.xlsx'

但是实际已经生成3quchong4.xlsx,所以3quchong4.xlsx是存在的。


相关推荐
穿西装的水獭2 小时前
python将Excel数据写进图片中
开发语言·python·excel
老友@2 小时前
Java Excel 导出:EasyExcel 使用详解
java·开发语言·excel·easyexcel·excel导出
郏国上11 小时前
查询数据库上所有表用到图片和视频的数据,并记录到excel表
mongodb·node.js·excel
OICQCO11 小时前
WPS Excel 图表
excel·wps
装不满的克莱因瓶11 小时前
【项目亮点】基于EasyExcel + 线程池解决POI文件导出时的内存溢出及超时问题
java·jvm·excel·线程池·async·虚拟机·easyexcel
njsgcs11 小时前
excel提取长宽,进行排版导出ezdxf 装箱算法 贪婪 总利用率91%
开发语言·python·excel
郏国上14 小时前
遍历访问阿里云节点下的所有文件信息并写入excel文件
数据库·mongodb·阿里云·excel
mudtools15 小时前
.NET驾驭Excel之力:Excel应用程序的创建与管理
c#·.net·excel·wps
mudtools16 小时前
.NET驾驭Excel之力:自动化数据处理 - 开篇概述与环境准备
c#·自动化·.net·excel·wps