Python读取Excel/CSV到MySQL

【1】Python读取CSV到MySQL

python 复制代码
import pandas as pd
from sqlalchemy import create_engine

# 数据库连接参数(请根据你的实际配置修改)
DB_USER = 'root'      # 如 root
DB_PASSWORD = '123456'  # 如 123456
DB_HOST = 'localhost'          # 或 127.0.0.1
DB_PORT = 3306
DB_NAME = 'travel_pmm'

# 构建数据库连接 URL
engine_url = f"mysql+pymysql://{DB_USER}:{DB_PASSWORD}@{DB_HOST}:{DB_PORT}/{DB_NAME}?charset=utf8mb4"

# 创建 SQLAlchemy 引擎
engine = create_engine(engine_url, echo=False)

# 读取 CSV 文件(假设文件在当前目录下)
df = pd.read_csv('trip_fujian_scenic_detail_20260214_155519.csv', encoding='utf-8')

# 可选:查看前几行确保数据正确
print(df.head())
print(df.dtypes)

# 将数据写入 MySQL 表(表名设为 travel_records)
# if_exists: 'fail'(默认), 'replace'(删旧建新), 'append'(追加)
df.to_sql(
    name='trip_fujian_scenic_detail',
    con=engine,
    if_exists='replace',  # 第一次用 replace,后续可用 append
    index=False,          # 不写入 pandas 的索引
    chunksize=1000        # 分批插入,提高性能
)

【2】Python读取xls到MySQL

python 复制代码
import pandas as pd
from sqlalchemy import create_engine

# === 1. 配置 MySQL 连接信息 ===
DB_USER = 'root'      # 如 root
DB_PASSWORD = '123456'  # 如 123456
DB_HOST = 'localhost'
DB_PORT = 3306
DB_NAME = 'travel_pmm'         # 你的数据库名

# 构建连接 URL(注意:charset=utf8mb4 支持 emoji 和中文)
engine_url = f"mysql+pymysql://{DB_USER}:{DB_PASSWORD}@{DB_HOST}:{DB_PORT}/{DB_NAME}?charset=utf8mb4"

# 创建数据库引擎
engine = create_engine(engine_url, echo=False)  # echo=True 可打印 SQL 日志

# === 2. 读取 Excel 文件 ===
# 假设文件名为 data.xlsx,位于当前目录
file_path = '1994-2024年度旅游数据3.xls'

# 读取第一个 sheet(默认)
df = pd.read_excel(file_path, engine='xlrd')
# df = pd.read_excel(file_path, engine='openpyxl')

# 如果要读取特定 sheet,用:
# df = pd.read_excel(file_path, sheet_name='Sheet1', engine='openpyxl')

# 可选:查看数据
print("✅ 数据前5行:")
print(df.head())
print("\n✅ 数据类型:")
print(df.dtypes)

# === 3. 数据清洗(可选但推荐)===
# 示例:去除列名前后空格
df.columns = df.columns.str.strip()

# 示例:处理 NaN 值(MySQL 不喜欢 NaN)
df = df.where(pd.notnull(df), None)  # 将 NaN 转为 None(对应 SQL 的 NULL)

# === 4. 写入 MySQL ===
table_name = 'travel_money_data'  # 目标表名

df.to_sql(
    name=table_name,
    con=engine,
    if_exists='append',   # 'fail'(默认), 'replace'(删表重建), 'append'(追加)
    index=False,          # 不写入 pandas 的行索引
    chunksize=1000,       # 分批插入,提升性能
    method='multi'        # 使用多值插入,加速
)

print(f"\n✅ 成功将 {len(df)} 行数据写入 MySQL 表 `{DB_NAME}.{table_name}`!")

【3】Python读取xlsx到MySQL

python 复制代码
import pandas as pd
from sqlalchemy import create_engine

# === 1. 配置 MySQL 连接信息 ===
DB_USER = 'root'      # 如 root
DB_PASSWORD = '123456'  # 如 123456
DB_HOST = 'localhost'
DB_PORT = 3306
DB_NAME = 'travel_pmm'         # 你的数据库名

# 构建连接 URL(注意:charset=utf8mb4 支持 emoji 和中文)
engine_url = f"mysql+pymysql://{DB_USER}:{DB_PASSWORD}@{DB_HOST}:{DB_PORT}/{DB_NAME}?charset=utf8mb4"

# 创建数据库引擎
engine = create_engine(engine_url, echo=False)  # echo=True 可打印 SQL 日志

# === 2. 读取 Excel 文件 ===
# 假设文件名为 data.xlsx,位于当前目录
file_path = '1994-2024年度旅游数据3.xls'

# 读取第一个 sheet(默认)
df = pd.read_excel(file_path, engine='openpyxl')

# 如果要读取特定 sheet,用:
# df = pd.read_excel(file_path, sheet_name='Sheet1', engine='openpyxl')

# 可选:查看数据
print("✅ 数据前5行:")
print(df.head())
print("\n✅ 数据类型:")
print(df.dtypes)

# === 3. 数据清洗(可选但推荐)===
# 示例:去除列名前后空格
df.columns = df.columns.str.strip()

# 示例:处理 NaN 值(MySQL 不喜欢 NaN)
df = df.where(pd.notnull(df), None)  # 将 NaN 转为 None(对应 SQL 的 NULL)

# === 4. 写入 MySQL ===
table_name = 'travel_money_data'  # 目标表名

df.to_sql(
    name=table_name,
    con=engine,
    if_exists='append',   # 'fail'(默认), 'replace'(删表重建), 'append'(追加)
    index=False,          # 不写入 pandas 的行索引
    chunksize=1000,       # 分批插入,提升性能
    method='multi'        # 使用多值插入,加速
)

print(f"\n✅ 成功将 {len(df)} 行数据写入 MySQL 表 `{DB_NAME}.{table_name}`!")
相关推荐
helloweilei1 天前
python 抽象基类
python
用户8356290780511 天前
Python 实现 PPT 转 HTML
后端·python
0xDevNull1 天前
MySQL索引进阶用法
后端·mysql
0xDevNull1 天前
MySQL索引用法
mysql
zone77391 天前
004:RAG 入门-LangChain读取PDF
后端·python·面试
zone77391 天前
005:RAG 入门-LangChain读取表格数据
后端·python·agent
程序员小崔日记2 天前
一篇文章彻底搞懂 MySQL 和 Redis:原理、区别、项目用法全解析(建议收藏)
redis·mysql·项目实战
武子康2 天前
大数据-241 离线数仓 - 实战:电商核心交易数据模型与 MySQL 源表设计(订单/商品/品类/店铺/支付)
大数据·后端·mysql
树獭非懒2 天前
AI大模型小白手册|Embedding 与向量数据库
后端·python·llm
唐叔在学习2 天前
就算没有服务器,我照样能够同步数据
后端·python·程序员