Python实现数据库与Excel文件之间的数据导入与导出

数据库和Excel文件是两种常见且重要的数据存储方式。数据库通常用于大规模数据的高效存储、管理和查询,而Excel则以其直观的界面和简单的操作方式广泛应用于数据分析、报告生成和可视化等领域。在实际工作中,可能需要在这两者之间进行数据的导入与导出。例如,从数据库中提取数据到Excel进行深入分析和图表绘制,或者将Excel文件中的数据清洗整理后导入数据库进行集中管理和进一步处理。而Python因其便捷性和丰富的生态,能够帮助用户通过简单的代码处理数据库与Excel文件之间数据转换。

本文将介绍如何使用Python有效地实现数据库与Excel文件之间的数据自动化导入与导出,以SQLite数据库为例。

文章目录

本文所使用的方法需要用到sqlite3(Python标准库中的组件)和Spire.XLS for Python(PyPI: pip install Spire.XLS)。

用Python将数据库数据导出到Excel表格

我们可以使用 sqlite3 模块从数据库读取数据,并利用 Spire.XLS 模块创建 Excel 文件并将数据写入其中,从而实现数据库数据的导出。详细步骤如下:

  1. 导入必要的模块。
  2. 连接数据库:使用 sqlite3.connect() 连接 SQLite 数据库,并创建游标 cursor 执行 SQL 命令。
  3. 获取表名:执行 SQL 查询获取数据库中所有表的名称,并存储在 tableNames 列表中。
  4. 创建 Excel 工作簿:初始化一个 Workbook 对象,并使用 Workbook.Worksheets.Clear() 方法清除默认工作表。
  5. 遍历数据库表:对于 tableNames 中的每一个表名:
    • 查询表的列信息,提取列名并添加到 columnNames 列表中。
    • 获取表中的所有数据行到 rows 中。
    • 使用 Workbook.Worksheets.Add(sheetname) 方法在 Excel 中添加一个以表名命名的新工作表。
    • 使用 Worksheet.Range[row, col].Value 属性将 columnNames 作为标题写入工作表。
    • 遍历数据行,并使用相同的属性将数据写入对应的单元格。
    • 格式化工作表。
  6. 使用 Workbook.SaveToFile() 方法将工作簿保存到文件。
  7. 释放 workbook 的资源并关闭数据库连接。

代码示例

python 复制代码
from spire.xls import *
from spire.xls.common import *
import sqlite3

# 连接到数据库
conn = sqlite3.connect("output/CompanyInfo.db")
cursor = conn.cursor()

# 获取数据库中所有的表名
cursor.execute("SELECT name FROM sqlite_master WHERE type='table';")
tableNames = [name[0] for name in cursor.fetchall()]

# 创建 Excel 文件
workbook = Workbook()
workbook.Worksheets.Clear()

# 遍历数据库中的每个表
for tableName in tableNames:
    # 获取表的列名
    cursor.execute(f"PRAGMA table_info('{tableName}')")
    columnsInfo = cursor.fetchall()
    columnNames = [columnInfo[1] for columnInfo in columnsInfo]

    # 获取表的数据
    cursor.execute(f"SELECT * FROM {tableName}")
    rows = cursor.fetchall()
    
    # 创建工作表
    sheet = workbook.Worksheets.Add(tableName)
    
    # 将标题行写入工作表
    for i in range(len(columnNames)):
        sheet.Range[1, i + 1].Value = columnNames[i]
    
    # 将数据写入工作表
    for j in range(1, len(rows)):
        column = rows[j]
        for k in range(len(column)):
            sheet.Range[j + 1, k + 1].Value = column[k]
    
    # 设置工作表格式
    sheet.AllocatedRange.Style.Font.FontName = "Times New Roman"
    sheet.AllocatedRange.Style.Font.Size = 12.0
    sheet.AllocatedRange.AutoFitRows()
    sheet.AllocatedRange.AutoFitColumns()

# 保存 Excel 文件
workbook.SaveToFile("output/DatabaseToExcel.xlsx", FileFormat.Version2016)
workbook.Dispose()
conn.close()

结果

用Python将Excel表格数据导入到数据库

我们也可以使用 Spire.XLS 从 Excel 文件读取各种数据类型,然后使用 sqlite3 将数据写入数据库。详细步骤如下:

  1. 导入必要的模块。
  2. 创建 Workbook 实例:初始化一个 Workbook 对象以操作 Excel 工作簿。
  3. 加载 Excel 文件:使用 LoadFromFile 方法从指定路径加载 Excel 文件。
  4. 连接数据库:使用 sqlite3.connect() 连接 SQLite 数据库,并创建游标 cursor 执行 SQL 命令。
  5. 遍历工作表:对于工作簿中的每个工作表:
    • 使用 Worksheet.Name 属性获取工作表对象和名称,并去除名称中的空格。
    • 提取标题:使用 Worksheet.Range[row, col].Value 属性收集第一行数据作为数据库表的列名,并去除空格。
    • 创建数据库表:基于提取的标题动态生成 SQL 语句以创建表(如果不存在)。
    • 插入数据:遍历工作表的每一行,使用 Worksheet.Range[row, col].Value 属性收集数据,然后构造 SQL 插入语句将数据插入相应的数据库表。
  6. 提交并关闭数据库连接:将所有更改提交到数据库并关闭数据库连接。
  7. 释放 Workbook 资源:清理 Workbook 对象所使用的资源。

代码示例

python 复制代码
from spire.xls import *
from spire.xls.common import *
import sqlite3

# 创建 Workbook 实例
workbook = Workbook()

# 加载 Excel 文件
workbook.LoadFromFile("Sample.xlsx")

# 连接到数据库
conn = sqlite3.connect("output/ExcelToDatabase.db")
cursor = conn.cursor()

for s in range(workbook.Worksheets.Count):
    # 获取一个工作表
    sheet = workbook.Worksheets.get_Item(s)

    # 获取工作表名称
    sheetName = sheet.Name
    sheetName = sheetName.replace(" ", "")

    # 获取标题行中的数据
    header = []
    for i in range(sheet.AllocatedRange.ColumnCount):
        headerValue = sheet.Range[1, i + 1].Value
        headerValue = headerValue.replace(" ", "")
        header.append(headerValue)

    # 创建数据库表
    createTableSql = f"CREATE TABLE IF NOT EXISTS {sheetName} ({', '.join([f'{header[i]} TEXT' for i in range(len(header))])})"
    cursor.execute(createTableSql)

    # 插入数据到数据库表中
    for row in range(1, sheet.AllocatedRange.RowCount):
        data = []
        for col in range(sheet.AllocatedRange.ColumnCount):
            # 获取单元格值
            value = sheet.Range[row + 1, col + 1].Value
            data.append(value)
        # 插入单元格值到数据库表中
        insertSql = f"INSERT INTO {sheetName} ({', '.join(header)}) VALUES ({', '.join(['?' for _ in data])})"
        cursor.execute(insertSql, data)

# 提交更改并关闭连接
conn.commit()
conn.close()

workbook.Dispose()

结果

本文展示了如何使用 Python 代码在 Excel 工作簿和数据库之间进行数据的导入与导出。

有关更多 Excel 文件处理技巧,请访问 Spire.XLS for Python教程

相关推荐
feihui3 分钟前
记一次 Python 服务 TCE 实例进程异常退出排查
python·gunicorn
超龄超能程序猿8 分钟前
使用 Python 对本地图片进行图像分类
开发语言·人工智能·python·机器学习·分类·数据挖掘·scipy
谢斯21 分钟前
[python]在drf中使用drf_spectacular
python·django
我爱一条柴ya23 分钟前
【AI大模型】RAG系统组件:向量数据库(ChromaDB)
数据库·人工智能·pytorch·python·ai·ai编程
北北~Simple24 分钟前
第一次搭建数据库
服务器·前端·javascript·数据库
鸢想睡觉24 分钟前
【数据库基础 1】MySQL环境部署及基本操作
数据库·mysql
没有口袋啦25 分钟前
《数据库》MySQL备份回复
数据库
c7_ln29 分钟前
MYSQL C_API使用全解
c语言·数据库·mysql
karry013032 分钟前
高并发导致重复key问题--org.springframework.dao.DuplicateKeyException
java·数据库·ide
天天爱吃肉82181 小时前
从零到一:深度解析汽车标定技术体系与实战策略
python·嵌入式硬件·自动化·汽车