tolist()读取Excel列数据,(Excel列数据去重后,重新保存到新的Excel里)

从Excel列数据去重后,重新保存到新的Excel里

python 复制代码
import pandas as pd

# 读取Excel文件
file = r"D:\\pythonXangmu\\quchong\\quchong.xlsx"  # 使用原始字符串以避免转义字符
df = pd.read_excel(file, sheet_name='nameSheet')

# 删除重复值
df2 = df.drop_duplicates(subset='name')#列名 subset='name'

# 从Excel列中提取值
names = df2['name'].tolist()
ages = df2['age'].tolist()

# 创建一个新的DataFrame
df3 = pd.DataFrame({'name': names, 'age': ages})

# 将新的DataFrame写入Excel文件
#df3.to_excel('3quchong4.xlsx', sheet_name='Sheet1', index=False)#这里不是绝对路径,代码虽然跑成功了,也能打印出结果,但是电脑上就是找不到文件3quchong4.xlsx,解决办法就是写成绝对路径,就会自动生成一个3quchong4.xlsx文件
df3.to_excel('D:\\pythonXangmu\\quchong\\3quchong4.xlsx', sheet_name='Sheet1', index=False)
#df4 =df3.to_excel('D:\\pythonXangmu\\quchong\\3quchong4.xlsx', sheet_name='Sheet1', index=False)
# 读取新创建的Excel文件
df5 = pd.read_excel('3quchong4.xlsx', sheet_name='Sheet1')#这里读取数据,一定是pandas.read_excel,不是 某个Excel表.read_excel,如df4.read_excel
#如:df5= df4.read_excel('quchong2.xlsx', sheet_name='Sheet1')#Excel表.read_excel 是个错误的写法
print('去重后5\n', df5)

这里还会报错:handle = open(handle, ioargs.mode)

FileNotFoundError: Errno 2 No such file or directory: '3quchong4.xlsx'

但是实际已经生成3quchong4.xlsx,所以3quchong4.xlsx是存在的。


相关推荐
海兰18 小时前
【web应用】Excel 项目数据自动化分析系统(AI 驱动分析)详细设计与部署指南(附源代码)
前端·人工智能·自动化·excel
2501_930707781 天前
使用 C# 代码读取或删除 Excel 文档属性
excel
hikktn1 天前
Excel 日期格式统一治理:从“显示不全“到“自动兼容“的完整方案
windows·python·excel
霸道流氓气质1 天前
Spring Boot 大数据量 Excel 导入导出功能实现指南
spring boot·后端·excel
霸道流氓气质1 天前
Java 单元测试生成大量 Excel 测试数据实战指南
java·单元测试·excel
IT WorryFree1 天前
FortiGate常用资产 OID 清单,配套 Excel 台账模板字段
网络·人工智能·excel
MyFreeIT1 天前
Excel Enable Content
excel
E_ICEBLUE1 天前
将 Excel 表格插入 Word 文档的三种实用方案(Python 自动化)
python·word·excel
俊哥工具1 天前
027免费开源硬盘检测工具,一键查看健康度,杜绝数据丢失
pdf·电脑·word·excel·音视频
不恋水的雨2 天前
easyexcel快速填充大数据量不覆盖后面的行解决方式
java·excel·poi