Python解析Excel入库如何做到行的拆分

我们读取解析Excel入库经常会遇到这种场景,那就是行的拆分,如图:

比如我们入库,要以name为主键,可是表格name的值全是以逗号分割的多个,这怎么办呢?这就必须拆成多行了啊。

代码如下:

python 复制代码
from sqlalchemy import create_engine
import numpy as np
import pandas as pd
conn = create_engine("mysql+pymysql://user:pass@host:3306/db")
df = pd.read_excel("test.xlsx")
df.dropna(subset=["name"])    #删除空行
droplist=[]                 #记录带逗号的行号
for i in df.index:          #遍历每一行
  df_line = df.loc[[i]]        #本行
  names = df.loc[i,'name']
  name_list = names.split(',') 
  #逗号分割超过一条,拆成多行
  if(len(name_list)>1):
    droplist.append(i)     #删除原来的行
    for name in name_list:
      name = name.strip()
      df_line.loc[i,'name'] = name   #修改本行的字段值 也就形成了新行
      df = pd.concat([df,line],ignore_index=True)  #拆分的新行附加到最后面
      
df.drop(droplist,axis=0,inplace=True)   #删除原来有逗号的行

这样我们就得到了新的df,已经完成了重组,如图

相关推荐
淮北494几秒前
STL学习(四、队列和堆栈)
开发语言·c++·学习
No0d1es4 分钟前
CPA青少年编程能力等级测评试卷及答案 Python编程(三级)
python·青少年编程·cpa
惜.己14 分钟前
pytest中使用ordering控制函数的执行顺序
开发语言·python·pytest
数据智能老司机35 分钟前
使用 Python 进行并行与高性能编程——并行编程导论
python·性能优化·编程语言
精灵vector1 小时前
【Agentic】通过LangGrah实现RAG评分和重写
python
狗都不学爬虫_1 小时前
JS逆向 - (国外)SHEIN站 - 请求头(armorToken、Anti-in)
javascript·python·ajax·网络爬虫·wasm
苦学编程的谢1 小时前
Mybatis_2
java·开发语言·后端·java-ee·mybatis
一百天成为python专家1 小时前
K-近邻算法
数据结构·python·算法·pandas·近邻算法·ipython·python3.11