PyMysql error : Packet Sequence Number Wrong - got 1 expected 0

文章目录

我自己知道的,这类问题有两类原因,两种解决方案。

错误一

错误原因

pymysql的主进程启动的connect无法给子进程中使用,所以读取大批量数据时最后容易出现了此类问题。

解决方案

换成pymysql-pool可以解决方法:

具体如下:

shell 复制代码
pip install pymysql-pool

代码如下:

python 复制代码
import pymysql
import pymysqlpool

def select_ebay_catelotory():
    config={'host': HOST, 'user': USER, 'password': PASSWD, 'database': DB, 'autocommit':True}
    pool1 = pymysqlpool.ConnectionPool(size=10, maxsize=20, pre_create_num=2, name='pool1', **config)
    con1 = pool1.get_connection()
    gcu = con1.cursor()
    try:
        gcu.execute(f"""SELECT *** """)

        # 获取剩余结果所有数据
        rows = gcu.fetchall()
    except Exception as e:
        print(e)
    finally:
        # gcu.close()
        con1.close()
    return rows

错误二

原因

要读取的内容太大了。有两类:某列太长了,总行数太多了。

如何确定?

你的代码读取100行没问题,1000行也没问题,10000行也没问题,100万行就有问题了。那就是这个原因。

解决方案

不要limit去读,太费时间:先取id,再用id去分批读取数据。

python 复制代码
import pymysql
import pymysqlpool

def select_all_ids():
    config={'host': HOST, 'user': USER, 'password': PASSWD, 'database': DB, 'autocommit':True}
    pool1 = pymysqlpool.ConnectionPool(size=35, maxsize=35, pre_create_num=2, name='pool1', **config)
    con1 = pool1.get_connection()
    gcu = con1.cursor()
    try:
        gcu.execute(f"""SELECT `id` FROM sfc_minesweeper.product_detail WHERE create_time>'2024-07-10' AND CHAR_LENGTH(result_data)>500""")

        # 获取剩余结果所有数据
        rows = gcu.fetchall()
    except Exception as e:
        print(e)
    finally:
        # gcu.close()
        con1.close()
    return rows


def select_ebay_catelotory(pids):
    config={'host': HOST, 'user': USER, 'password': PASSWD, 'database': DB, 'autocommit':True}
    pool1 = pymysqlpool.ConnectionPool(size=35, maxsize=35, pre_create_num=2, name='pool1', **config)
    con1 = pool1.get_connection()
    gcu = con1.cursor()
    try:
        gcu.execute(f"""SELECT `id`, `result_data`, `product_offer_id` FROM sfc_minesweeper.product_detail WHERE id in {tuple(pids)}""")

        # 获取剩余结果所有数据
        rows = gcu.fetchall()
    except Exception as e:
        print(e)
    finally:
        # gcu.close()
        con1.close()
    return rows

# 先拿到所有id
pd_ids = [e[0] for e in select_all_ids()]
# 再分批读取
pd1688s = []
step = 4000
for begin in range(0, len(pd_ids), step):
    pd1688s.extend([e for e in select_ebay_catelotory(pd_ids[begin:begin+step])])
    print(i, len(pd1688s))
相关推荐
DemonAvenger几秒前
MySQL存储引擎深度对比:InnoDB vs MyISAM及其应用场景解析
数据库·mysql·性能优化
paid槮31 分钟前
MySQL的简单介绍
数据库·mysql
不羁。。9 小时前
【撸靶笔记】第八关:GET - Blind - Boolian Based - Single Quotes
数据库·sql·mybatis
AwhiteV10 小时前
利用图数据库高效解决 Text2sql 任务中表结构复杂时占用过多大模型上下文的问题
数据库·人工智能·自然语言处理·oracle·大模型·text2sql
m0_5951998510 小时前
Redis(以Django为例,含具体操作步骤)
数据库·redis·缓存
爱尚你199310 小时前
MySQL 三大日志:redo log、undo log、binlog 详解
数据库·mysql
小猿姐12 小时前
KubeBlocks AI:AI时代的云原生数据库运维探索
数据库·人工智能·云原生·kubeblocks
NocoBase13 小时前
10 个开源工具,快速构建数据应用
数据库·低代码·开源
麻辣清汤14 小时前
结合BI多维度异常分析(日期-> 商家/渠道->日期(商家/渠道))
数据库·python·sql·finebi
Kan先生15 小时前
对象存储解决方案:MinIO 的架构与代码实战
数据库·python