Python迭代器-大数据量的处理

一 生成器的实际使用(大量数据的导出)

python 复制代码
#分批导出数据然后分批写入excel
import pandas as pd
import openpyxl
from openpyxl.utils.dataframe import dataframe_to_rows


def execute_query(query):
    # 假设这是执行 SQL 查询的函数
    # 返回查询结果
    pass


def fetch_products_in_batches(batch_size=1000):
    offset = 0
    while True:
        query = f"SELECT * FROM products LIMIT {batch_size} OFFSET {offset}"
        results = execute_query(query)
        if not results:
            break
        yield results
        offset += batch_size


def export_to_excel(generator, filename):
    # 创建一个新的 Excel 工作簿
    wb = openpyxl.Workbook()
    ws = wb.active

    # 写入表头
    first_batch = next(generator)
    df = pd.DataFrame(first_batch)
    for r in dataframe_to_rows(df, index=False, header=True):
        ws.append(r)

    # 写入后续批次的数据
    for batch in generator:
        df = pd.DataFrame(batch)
        for r in dataframe_to_rows(df, index=False, header=False):
            ws.append(r)

    # 保存工作簿
    wb.save(filename)


# 主逻辑
generator = fetch_products_in_batches()
export_to_excel(generator, 'products.xlsx')
相关推荐
闲看庭前梦落花5 分钟前
Tensorflow实现手写数字识别
人工智能·python·tensorflow
bluebonnet271 小时前
【python】转移本地安装的python包
java·python·eureka
amazinging1 小时前
北京-4年功能测试2年空窗-报培训班学测开-今天来聊聊我的痛苦
python·功能测试·学习·面试
超级晒盐人1 小时前
vue 开发总结:从安装到第一个交互页面-与数据库API
经验分享·python·语言模型·学习方法·微信公众平台
AI 嗯啦2 小时前
机器学习 —— 决策树
python·机器学习
睿思达DBA_WGX3 小时前
Python 程序设计讲义(36):字符串的处理方法——去除字符串头尾字符:strip() 方法、lstrip() 方法与rstrip() 方法
开发语言·python
阿蒙Amon3 小时前
详解Python标准库之互联网数据处理
网络·数据库·python
淦暴尼3 小时前
每日五个pyecharts可视化图表-bars(1)
python·信息可视化·echarts
啊哈哈哈哈哈啊哈哈4 小时前
G9打卡——ACGAN
python·生成对抗网络·gan
ALLSectorSorft4 小时前
相亲小程序用户注册与登录系统模块搭建
java·大数据·服务器·数据库·python