Python实现数据库与Excel文件之间的数据导入与导出

数据库和Excel文件是两种常见且重要的数据存储方式。数据库通常用于大规模数据的高效存储、管理和查询,而Excel则以其直观的界面和简单的操作方式广泛应用于数据分析、报告生成和可视化等领域。在实际工作中,可能需要在这两者之间进行数据的导入与导出。例如,从数据库中提取数据到Excel进行深入分析和图表绘制,或者将Excel文件中的数据清洗整理后导入数据库进行集中管理和进一步处理。而Python因其便捷性和丰富的生态,能够帮助用户通过简单的代码处理数据库与Excel文件之间数据转换。

本文将介绍如何使用Python有效地实现数据库与Excel文件之间的数据自动化导入与导出,以SQLite数据库为例。

文章目录

本文所使用的方法需要用到sqlite3(Python标准库中的组件)和Spire.XLS for Python(PyPI: pip install Spire.XLS)。

用Python将数据库数据导出到Excel表格

我们可以使用 sqlite3 模块从数据库读取数据,并利用 Spire.XLS 模块创建 Excel 文件并将数据写入其中,从而实现数据库数据的导出。详细步骤如下:

  1. 导入必要的模块。
  2. 连接数据库:使用 sqlite3.connect() 连接 SQLite 数据库,并创建游标 cursor 执行 SQL 命令。
  3. 获取表名:执行 SQL 查询获取数据库中所有表的名称,并存储在 tableNames 列表中。
  4. 创建 Excel 工作簿:初始化一个 Workbook 对象,并使用 Workbook.Worksheets.Clear() 方法清除默认工作表。
  5. 遍历数据库表:对于 tableNames 中的每一个表名:
    • 查询表的列信息,提取列名并添加到 columnNames 列表中。
    • 获取表中的所有数据行到 rows 中。
    • 使用 Workbook.Worksheets.Add(sheetname) 方法在 Excel 中添加一个以表名命名的新工作表。
    • 使用 Worksheet.Range[row, col].Value 属性将 columnNames 作为标题写入工作表。
    • 遍历数据行,并使用相同的属性将数据写入对应的单元格。
    • 格式化工作表。
  6. 使用 Workbook.SaveToFile() 方法将工作簿保存到文件。
  7. 释放 workbook 的资源并关闭数据库连接。

代码示例

python 复制代码
from spire.xls import *
from spire.xls.common import *
import sqlite3

# 连接到数据库
conn = sqlite3.connect("output/CompanyInfo.db")
cursor = conn.cursor()

# 获取数据库中所有的表名
cursor.execute("SELECT name FROM sqlite_master WHERE type='table';")
tableNames = [name[0] for name in cursor.fetchall()]

# 创建 Excel 文件
workbook = Workbook()
workbook.Worksheets.Clear()

# 遍历数据库中的每个表
for tableName in tableNames:
    # 获取表的列名
    cursor.execute(f"PRAGMA table_info('{tableName}')")
    columnsInfo = cursor.fetchall()
    columnNames = [columnInfo[1] for columnInfo in columnsInfo]

    # 获取表的数据
    cursor.execute(f"SELECT * FROM {tableName}")
    rows = cursor.fetchall()
    
    # 创建工作表
    sheet = workbook.Worksheets.Add(tableName)
    
    # 将标题行写入工作表
    for i in range(len(columnNames)):
        sheet.Range[1, i + 1].Value = columnNames[i]
    
    # 将数据写入工作表
    for j in range(1, len(rows)):
        column = rows[j]
        for k in range(len(column)):
            sheet.Range[j + 1, k + 1].Value = column[k]
    
    # 设置工作表格式
    sheet.AllocatedRange.Style.Font.FontName = "Times New Roman"
    sheet.AllocatedRange.Style.Font.Size = 12.0
    sheet.AllocatedRange.AutoFitRows()
    sheet.AllocatedRange.AutoFitColumns()

# 保存 Excel 文件
workbook.SaveToFile("output/DatabaseToExcel.xlsx", FileFormat.Version2016)
workbook.Dispose()
conn.close()

结果

用Python将Excel表格数据导入到数据库

我们也可以使用 Spire.XLS 从 Excel 文件读取各种数据类型,然后使用 sqlite3 将数据写入数据库。详细步骤如下:

  1. 导入必要的模块。
  2. 创建 Workbook 实例:初始化一个 Workbook 对象以操作 Excel 工作簿。
  3. 加载 Excel 文件:使用 LoadFromFile 方法从指定路径加载 Excel 文件。
  4. 连接数据库:使用 sqlite3.connect() 连接 SQLite 数据库,并创建游标 cursor 执行 SQL 命令。
  5. 遍历工作表:对于工作簿中的每个工作表:
    • 使用 Worksheet.Name 属性获取工作表对象和名称,并去除名称中的空格。
    • 提取标题:使用 Worksheet.Range[row, col].Value 属性收集第一行数据作为数据库表的列名,并去除空格。
    • 创建数据库表:基于提取的标题动态生成 SQL 语句以创建表(如果不存在)。
    • 插入数据:遍历工作表的每一行,使用 Worksheet.Range[row, col].Value 属性收集数据,然后构造 SQL 插入语句将数据插入相应的数据库表。
  6. 提交并关闭数据库连接:将所有更改提交到数据库并关闭数据库连接。
  7. 释放 Workbook 资源:清理 Workbook 对象所使用的资源。

代码示例

python 复制代码
from spire.xls import *
from spire.xls.common import *
import sqlite3

# 创建 Workbook 实例
workbook = Workbook()

# 加载 Excel 文件
workbook.LoadFromFile("Sample.xlsx")

# 连接到数据库
conn = sqlite3.connect("output/ExcelToDatabase.db")
cursor = conn.cursor()

for s in range(workbook.Worksheets.Count):
    # 获取一个工作表
    sheet = workbook.Worksheets.get_Item(s)

    # 获取工作表名称
    sheetName = sheet.Name
    sheetName = sheetName.replace(" ", "")

    # 获取标题行中的数据
    header = []
    for i in range(sheet.AllocatedRange.ColumnCount):
        headerValue = sheet.Range[1, i + 1].Value
        headerValue = headerValue.replace(" ", "")
        header.append(headerValue)

    # 创建数据库表
    createTableSql = f"CREATE TABLE IF NOT EXISTS {sheetName} ({', '.join([f'{header[i]} TEXT' for i in range(len(header))])})"
    cursor.execute(createTableSql)

    # 插入数据到数据库表中
    for row in range(1, sheet.AllocatedRange.RowCount):
        data = []
        for col in range(sheet.AllocatedRange.ColumnCount):
            # 获取单元格值
            value = sheet.Range[row + 1, col + 1].Value
            data.append(value)
        # 插入单元格值到数据库表中
        insertSql = f"INSERT INTO {sheetName} ({', '.join(header)}) VALUES ({', '.join(['?' for _ in data])})"
        cursor.execute(insertSql, data)

# 提交更改并关闭连接
conn.commit()
conn.close()

workbook.Dispose()

结果

本文展示了如何使用 Python 代码在 Excel 工作簿和数据库之间进行数据的导入与导出。

有关更多 Excel 文件处理技巧,请访问 Spire.XLS for Python教程

相关推荐
databook8 小时前
Manim实现脉冲闪烁特效
后端·python·动效
程序设计实验室8 小时前
2025年了,在 Django 之外,Python Web 框架还能怎么选?
python
倔强青铜三9 小时前
苦练Python第46天:文件写入与上下文管理器
人工智能·python·面试
用户25191624271113 小时前
Python之语言特点
python
RestCloud13 小时前
SQL Server到Hive:批处理ETL性能提升30%的实战经验
数据库·api
刘立军13 小时前
使用pyHugeGraph查询HugeGraph图数据
python·graphql
RestCloud13 小时前
为什么说零代码 ETL 是未来趋势?
数据库·api
ClouGence15 小时前
CloudCanal + Paimon + SelectDB 从 0 到 1 构建实时湖仓
数据库
数据智能老司机17 小时前
精通 Python 设计模式——创建型设计模式
python·设计模式·架构
数据智能老司机18 小时前
精通 Python 设计模式——SOLID 原则
python·设计模式·架构