tolist()读取Excel列数据,(Excel列数据去重后,重新保存到新的Excel里)

从Excel列数据去重后,重新保存到新的Excel里

python 复制代码
import pandas as pd

# 读取Excel文件
file = r"D:\\pythonXangmu\\quchong\\quchong.xlsx"  # 使用原始字符串以避免转义字符
df = pd.read_excel(file, sheet_name='nameSheet')

# 删除重复值
df2 = df.drop_duplicates(subset='name')#列名 subset='name'

# 从Excel列中提取值
names = df2['name'].tolist()
ages = df2['age'].tolist()

# 创建一个新的DataFrame
df3 = pd.DataFrame({'name': names, 'age': ages})

# 将新的DataFrame写入Excel文件
#df3.to_excel('3quchong4.xlsx', sheet_name='Sheet1', index=False)#这里不是绝对路径,代码虽然跑成功了,也能打印出结果,但是电脑上就是找不到文件3quchong4.xlsx,解决办法就是写成绝对路径,就会自动生成一个3quchong4.xlsx文件
df3.to_excel('D:\\pythonXangmu\\quchong\\3quchong4.xlsx', sheet_name='Sheet1', index=False)
#df4 =df3.to_excel('D:\\pythonXangmu\\quchong\\3quchong4.xlsx', sheet_name='Sheet1', index=False)
# 读取新创建的Excel文件
df5 = pd.read_excel('3quchong4.xlsx', sheet_name='Sheet1')#这里读取数据,一定是pandas.read_excel,不是 某个Excel表.read_excel,如df4.read_excel
#如:df5= df4.read_excel('quchong2.xlsx', sheet_name='Sheet1')#Excel表.read_excel 是个错误的写法
print('去重后5\n', df5)

这里还会报错:handle = open(handle, ioargs.mode)

FileNotFoundError: Errno 2 No such file or directory: '3quchong4.xlsx'

但是实际已经生成3quchong4.xlsx,所以3quchong4.xlsx是存在的。


相关推荐
tsfy20033 小时前
Python批量调整Excel格式,并排版导出PDF
python·pdf·excel
快乐的哈士奇5 小时前
Gmail-邮件自动处理系统
node.js·自动化·excel
123的故事21 小时前
工具分享(7)-多Excel文件内容查询工具
c#·excel·实用工具
hikktn1 天前
Excel 导出 OOM 预防实战:30 万行从堆溢出到 50MB 的演进
java·excel·easyexcel
yunceqing1 天前
从Excel调度到TMS平台:物流软件开发避坑清单
大数据·前端·网络·人工智能·excel·推荐算法
什仙1 天前
Mathcad Prime 对比 Excel/MATLAB/Mathematica:核心优势速览
excel
快乐的哈士奇1 天前
【Next.js实战②】Excel 派送表动态解析:表头识别与 FIELD_ALIASES 映射
前端·javascript·excel
daols881 天前
vue vxe-table 复制数据到 Excel:支持带表头复制
vue.js·excel·vxe-table
海兰2 天前
【web应用】Excel 项目数据自动化分析系统(AI 驱动分析)详细设计与部署指南(附源代码)
前端·人工智能·自动化·excel
2501_930707782 天前
使用 C# 代码读取或删除 Excel 文档属性
excel