Python解析Excel入库如何做到行的拆分

我们读取解析Excel入库经常会遇到这种场景,那就是行的拆分,如图:

比如我们入库,要以name为主键,可是表格name的值全是以逗号分割的多个,这怎么办呢?这就必须拆成多行了啊。

代码如下:

python 复制代码
from sqlalchemy import create_engine
import numpy as np
import pandas as pd
conn = create_engine("mysql+pymysql://user:pass@host:3306/db")
df = pd.read_excel("test.xlsx")
df.dropna(subset=["name"])    #删除空行
droplist=[]                 #记录带逗号的行号
for i in df.index:          #遍历每一行
  df_line = df.loc[[i]]        #本行
  names = df.loc[i,'name']
  name_list = names.split(',') 
  #逗号分割超过一条,拆成多行
  if(len(name_list)>1):
    droplist.append(i)     #删除原来的行
    for name in name_list:
      name = name.strip()
      df_line.loc[i,'name'] = name   #修改本行的字段值 也就形成了新行
      df = pd.concat([df,line],ignore_index=True)  #拆分的新行附加到最后面
      
df.drop(droplist,axis=0,inplace=True)   #删除原来有逗号的行

这样我们就得到了新的df,已经完成了重组,如图

相关推荐
白露与泡影几秒前
2025互联网大厂高频Java面试真题解析
java·开发语言·面试
gopyer4 分钟前
180课时吃透Go语言游戏后端开发2:Go语言中的变量
开发语言·游戏·golang·游戏后端开发
月月吃喝6 分钟前
【PyQt5】嵌套多线程数据交互实现
开发语言·qt·交互
匿名45910 分钟前
Lombok注解使用无效的情况(未能获得后端数据)
java·开发语言
徐子童27 分钟前
JVM高频面试题---GC垃圾回收
java·开发语言·jvm·面试题·gc·垃圾回收算法
Z_z在努力42 分钟前
【数据结构】队列(Queue)全面详解
java·开发语言·数据结构
唐叔在学习1 小时前
pip安装太慢?一键切换国内镜像源,速度飞起!
后端·python
Gz、1 小时前
Spring Boot 常用注解详解
spring boot·后端·python
起风了___1 小时前
Python 自动化下载夸克网盘分享文件:基于 Playwright 的完整实现(含登录态持久化与提取码处理)
后端·python
我是华为OD~HR~栗栗呀1 小时前
测试转C++开发面经(华为OD)
java·c++·后端·python·华为od·华为·面试