Python读取Excel/CSV到MySQL

【1】Python读取CSV到MySQL

python 复制代码
import pandas as pd
from sqlalchemy import create_engine

# 数据库连接参数(请根据你的实际配置修改)
DB_USER = 'root'      # 如 root
DB_PASSWORD = '123456'  # 如 123456
DB_HOST = 'localhost'          # 或 127.0.0.1
DB_PORT = 3306
DB_NAME = 'travel_pmm'

# 构建数据库连接 URL
engine_url = f"mysql+pymysql://{DB_USER}:{DB_PASSWORD}@{DB_HOST}:{DB_PORT}/{DB_NAME}?charset=utf8mb4"

# 创建 SQLAlchemy 引擎
engine = create_engine(engine_url, echo=False)

# 读取 CSV 文件(假设文件在当前目录下)
df = pd.read_csv('trip_fujian_scenic_detail_20260214_155519.csv', encoding='utf-8')

# 可选:查看前几行确保数据正确
print(df.head())
print(df.dtypes)

# 将数据写入 MySQL 表(表名设为 travel_records)
# if_exists: 'fail'(默认), 'replace'(删旧建新), 'append'(追加)
df.to_sql(
    name='trip_fujian_scenic_detail',
    con=engine,
    if_exists='replace',  # 第一次用 replace,后续可用 append
    index=False,          # 不写入 pandas 的索引
    chunksize=1000        # 分批插入,提高性能
)

【2】Python读取xls到MySQL

python 复制代码
import pandas as pd
from sqlalchemy import create_engine

# === 1. 配置 MySQL 连接信息 ===
DB_USER = 'root'      # 如 root
DB_PASSWORD = '123456'  # 如 123456
DB_HOST = 'localhost'
DB_PORT = 3306
DB_NAME = 'travel_pmm'         # 你的数据库名

# 构建连接 URL(注意:charset=utf8mb4 支持 emoji 和中文)
engine_url = f"mysql+pymysql://{DB_USER}:{DB_PASSWORD}@{DB_HOST}:{DB_PORT}/{DB_NAME}?charset=utf8mb4"

# 创建数据库引擎
engine = create_engine(engine_url, echo=False)  # echo=True 可打印 SQL 日志

# === 2. 读取 Excel 文件 ===
# 假设文件名为 data.xlsx,位于当前目录
file_path = '1994-2024年度旅游数据3.xls'

# 读取第一个 sheet(默认)
df = pd.read_excel(file_path, engine='xlrd')
# df = pd.read_excel(file_path, engine='openpyxl')

# 如果要读取特定 sheet,用:
# df = pd.read_excel(file_path, sheet_name='Sheet1', engine='openpyxl')

# 可选:查看数据
print("✅ 数据前5行:")
print(df.head())
print("\n✅ 数据类型:")
print(df.dtypes)

# === 3. 数据清洗(可选但推荐)===
# 示例:去除列名前后空格
df.columns = df.columns.str.strip()

# 示例:处理 NaN 值(MySQL 不喜欢 NaN)
df = df.where(pd.notnull(df), None)  # 将 NaN 转为 None(对应 SQL 的 NULL)

# === 4. 写入 MySQL ===
table_name = 'travel_money_data'  # 目标表名

df.to_sql(
    name=table_name,
    con=engine,
    if_exists='append',   # 'fail'(默认), 'replace'(删表重建), 'append'(追加)
    index=False,          # 不写入 pandas 的行索引
    chunksize=1000,       # 分批插入,提升性能
    method='multi'        # 使用多值插入,加速
)

print(f"\n✅ 成功将 {len(df)} 行数据写入 MySQL 表 `{DB_NAME}.{table_name}`!")

【3】Python读取xlsx到MySQL

python 复制代码
import pandas as pd
from sqlalchemy import create_engine

# === 1. 配置 MySQL 连接信息 ===
DB_USER = 'root'      # 如 root
DB_PASSWORD = '123456'  # 如 123456
DB_HOST = 'localhost'
DB_PORT = 3306
DB_NAME = 'travel_pmm'         # 你的数据库名

# 构建连接 URL(注意:charset=utf8mb4 支持 emoji 和中文)
engine_url = f"mysql+pymysql://{DB_USER}:{DB_PASSWORD}@{DB_HOST}:{DB_PORT}/{DB_NAME}?charset=utf8mb4"

# 创建数据库引擎
engine = create_engine(engine_url, echo=False)  # echo=True 可打印 SQL 日志

# === 2. 读取 Excel 文件 ===
# 假设文件名为 data.xlsx,位于当前目录
file_path = '1994-2024年度旅游数据3.xls'

# 读取第一个 sheet(默认)
df = pd.read_excel(file_path, engine='openpyxl')

# 如果要读取特定 sheet,用:
# df = pd.read_excel(file_path, sheet_name='Sheet1', engine='openpyxl')

# 可选:查看数据
print("✅ 数据前5行:")
print(df.head())
print("\n✅ 数据类型:")
print(df.dtypes)

# === 3. 数据清洗(可选但推荐)===
# 示例:去除列名前后空格
df.columns = df.columns.str.strip()

# 示例:处理 NaN 值(MySQL 不喜欢 NaN)
df = df.where(pd.notnull(df), None)  # 将 NaN 转为 None(对应 SQL 的 NULL)

# === 4. 写入 MySQL ===
table_name = 'travel_money_data'  # 目标表名

df.to_sql(
    name=table_name,
    con=engine,
    if_exists='append',   # 'fail'(默认), 'replace'(删表重建), 'append'(追加)
    index=False,          # 不写入 pandas 的行索引
    chunksize=1000,       # 分批插入,提升性能
    method='multi'        # 使用多值插入,加速
)

print(f"\n✅ 成功将 {len(df)} 行数据写入 MySQL 表 `{DB_NAME}.{table_name}`!")
相关推荐
2601_956139429 小时前
广州VI设计公司哪家强
linux·运维·服务器·python
databook10 小时前
让数学公式自动推导
python·数学·动效
m0_7335654610 小时前
如何指定PHP版本运行phpMyAdmin_多版本共存配置
jvm·数据库·python
love530love10 小时前
ComfyUI MediaPipe 猴子补丁终极完善版:补全上下文管理与姿态检测兼容
人工智能·windows·python·comfyui·protobuf·mediapipe
小小编程路10 小时前
新手快速学 Python 极简速成指南
开发语言·c++·python
小马过河R11 小时前
RAG检索优化策略:系统性四层框架解析
人工智能·python·算法·ai·llm·rag·问答
yzx99101311 小时前
脚本定制从入门到实践:打造你的专属浏览器助手
python
AI技术控11 小时前
论文解读:AE-TCN-SA——基于自编码器、TCN 与自注意力机制的锂电池内短路诊断方法
人工智能·python·深度学习·算法·机器学习·自然语言处理
向日的葵00611 小时前
阿里云OSS从0到1实战:为宠物收养系统打造图片上传功能
python·阿里云·云计算·pillow·fastapi·宠物
川冰ICE11 小时前
Python爬虫实战⑳|Pandas时间序列,趋势分析一网打尽
爬虫·python·pandas