tolist()读取Excel列数据,(Excel列数据去重后,重新保存到新的Excel里)

从Excel列数据去重后,重新保存到新的Excel里

python 复制代码
import pandas as pd

# 读取Excel文件
file = r"D:\\pythonXangmu\\quchong\\quchong.xlsx"  # 使用原始字符串以避免转义字符
df = pd.read_excel(file, sheet_name='nameSheet')

# 删除重复值
df2 = df.drop_duplicates(subset='name')#列名 subset='name'

# 从Excel列中提取值
names = df2['name'].tolist()
ages = df2['age'].tolist()

# 创建一个新的DataFrame
df3 = pd.DataFrame({'name': names, 'age': ages})

# 将新的DataFrame写入Excel文件
#df3.to_excel('3quchong4.xlsx', sheet_name='Sheet1', index=False)#这里不是绝对路径,代码虽然跑成功了,也能打印出结果,但是电脑上就是找不到文件3quchong4.xlsx,解决办法就是写成绝对路径,就会自动生成一个3quchong4.xlsx文件
df3.to_excel('D:\\pythonXangmu\\quchong\\3quchong4.xlsx', sheet_name='Sheet1', index=False)
#df4 =df3.to_excel('D:\\pythonXangmu\\quchong\\3quchong4.xlsx', sheet_name='Sheet1', index=False)
# 读取新创建的Excel文件
df5 = pd.read_excel('3quchong4.xlsx', sheet_name='Sheet1')#这里读取数据,一定是pandas.read_excel,不是 某个Excel表.read_excel,如df4.read_excel
#如:df5= df4.read_excel('quchong2.xlsx', sheet_name='Sheet1')#Excel表.read_excel 是个错误的写法
print('去重后5\n', df5)

这里还会报错:handle = open(handle, ioargs.mode)

FileNotFoundError: Errno 2 No such file or directory: '3quchong4.xlsx'

但是实际已经生成3quchong4.xlsx,所以3quchong4.xlsx是存在的。


相关推荐
jarreyer3 小时前
【数据分析绘图】excel绘图和bi工具区别
数据挖掘·数据分析·excel
chatexcel4 小时前
ChatExcel Max使用教程:图片、PDF、网页与复杂Excel的一站式数据分析
数据分析·pdf·excel
cngkqy4 小时前
excel从某一列中用match筛选匹配的数据
excel
qq_546937275 小时前
Excel批量转PDF_Word_图片,支持自动合并报表,效率翻倍。
pdf·word·excel
ai_coder_ai5 小时前
在自动化脚本中操作excel文件
运维·自动化·excel
三千花灯6 小时前
【Playwright】 自动化测试之参数化登录(Excel/CSV 数据源)
人工智能·机器学习·excel
罗政6 小时前
AI工作流实现Excel全自动化(支持SQL)-案例:医院门诊排班表
人工智能·自动化·excel
小妖6666 小时前
excel 怎么在单元格内容自动加上一段文字不能用公式
excel·vba
asdzx671 天前
Python 优雅解析 Excel:从原生行列到强类型对象的三层数据结构演进
数据结构·python·excel
罗政1 天前
AI工作流实现Excel自动化+SQL,零 VBA ,零公式,电商订单分析案例 | DTBot
sql·自动化·excel