SQLite批量INSERT

SQLite是一种轻量级、零配置的数据库管理系统。它的数据存储在一个单一的磁盘文件上,使得它非常适合嵌入式系统和移动应用。

在SQLite数据库中进行大批量记录INSERT,有三种方法,三种方法的效率由高低,本文举例说明。

方法一:逐条记录INSERT,这也是效率最低的方法

下面以逐条记录INSERT的方法,向SQLite数据库插入1000条数据,看一下耗时多长。

预先创建数据库myDB.db,在其中创建表myTabel:

sql 复制代码
CREATE TABLE IF NOT EXISTS my_table ( \
                            id INTEGER PRIMARY KEY, \
                            a TEXT, \
                            b INTEGER)

其中,id字段为自增字段,INSERT时,只需要提供a和b的值即可,代码如下:

cpp 复制代码
#include <chrono>
#include <iostream>
#include <thread>
#include <QSqlDatabase>
#include <QSqlQuery>
#include <QSqlError>

//方式一:单条记录逐条INSERT
auto tms = std::chrono::duration_cast<std::chrono::milliseconds>(std::chrono::system_clock().now().time_since_epoch()).count();
for(int i = 0; i < 1000; i++)
{
    int b = i + 1;
    QString a = QString("a_%1").arg(b);
    sql = QString("INSERT INTO myTable (a, b) VALUES('%1', %2)").arg(a).arg(b);
    if(!query.exec(sql))
    {
        std::cout << "INSERT INTO failed" << std::endl;
        db.close();
        return 0;
    }
}
auto tme = std::chrono::duration_cast<std::chrono::milliseconds>(std::chrono::system_clock().now().time_since_epoch()).count();
int span = static_cast<int>(tme - tms);
std::cout << "方式一:插入1000条记录耗时 " << span << " 毫秒!" << std::endl;
//以上程序输出 方式一:插入1000条记录耗时 171978 毫秒!

以上可见,使用逐条记录INSERT的方法,插入1000条记录到SQLite数据库,需要耗时172秒(171987毫秒)!

方法二,使用 UNION ALL 的SQL语句批量INSERT,这个方法效率居中

"UNION ALL" 是一种用来合并两个或多个 SQL 查询结果集的操作符。与 "UNION" 不同的是,"UNION ALL" 不会去重查询结果集,而是将所有的行都包含在结果中。

SQLite中的代码生成器会使用一种递归算法来对复合SELECT语句进行处理。对栈的大小有必要进行一下限制,我们会因为这个缘故对复合SELECT中的段落数量进行限制。段落的最大数量限制参数就是 SQLITE_MAX_COMPOUND_SELECT ,其默认值为 500。

由于UNION ALL的记录数目最大被限制为500条,因此,以下代码中,将1000条记录分拆成500条的2个部分进行INSERT操作:

cpp 复制代码
//方式二:1000条记录合并到一个INSERT语句插入
//SQLITE_MAX_COMPOUND_SELECT限制500条
auto tms = std::chrono::duration_cast<std::chrono::milliseconds>(std::chrono::system_clock().now().time_since_epoch()).count();
QString sql = "INSERT INTO my_table(a, b) ";
for(int i = 0; i < 500; i++)
{
    int b = i + 1;
    QString a = QString("a_%1").arg(b);

    sql += QString("SELECT '%1', %2 ").arg(a).arg(b);
    if(i != 499)
        sql += "UNION ALL ";
}
if(!query.exec(sql))
{
    std::cout << "UNION 1 INSERT INTO failed : " << query.lastError().text().toStdString() << std::endl;
    db.close();
    return;
}
sql = "INSERT INTO my_table(a, b) ";
for(int i = 500; i < 1000; i++)
{
    int b = i + 1;
    QString a = QString("a_%1").arg(b);

    sql += QString("SELECT '%1', %2 ").arg(a).arg(b);
    if(i != 999)
        sql += "UNION ALL ";
}
if(!query.exec(sql))
{
    std::cout << "UNION 2 INSERT INTO failed : " << query.lastError().text().toStdString() << std::endl;
    db.close();
    return;
}
auto tme = std::chrono::duration_cast<std::chrono::milliseconds>(std::chrono::system_clock().now().time_since_epoch()).count();
int span = static_cast<int>(tme - tms);
std::cout << "方式二:插入1000条记录耗时 " << span << " 毫秒!" << std::endl;
//以上程序输出 方式二:插入1000条记录耗时 310 毫秒!

以上可见,使用UNION ALL的SQL语句批量INSERT的方法,插入1000条记录到SQLite数据库,需要耗时0.31秒(310毫秒)!

方法三,开启事务,逐条记录INSERT,提交事务,这是效率最高的方法

在SQLite中,事务是一种机制,用于确保数据库操作的一致性和完整性。事务通过保证一系列操作的成功或失败不会影响数据库的状态来实现这一点。

以下代码通过启动事务,逐条插入,最后提交事务的方式将1000条记录插入SQLite数据库:

cpp 复制代码
//方式三:启动事务,单条记录逐条INSERT,提交事务
auto tms = std::chrono::duration_cast<std::chrono::milliseconds>(std::chrono::system_clock().now().time_since_epoch()).count();

//启动事务
db.transaction();

//逐条插入
for(int i = 0; i < 1000; i++)
{
    int b = i + 1;
    QString a = QString("a_%1").arg(b);
    sql = QString("INSERT INTO my_table (a, b) VALUES('%1', %2)").arg(a).arg(b);
    if(!query.exec(sql))
    {
        std::cout << "transaction INSERT INTO failed" << std::endl;
        db.rollback();
        db.close();
        return;
    }
}

//提交事务
db.commit();

auto tme = std::chrono::duration_cast<std::chrono::milliseconds>(std::chrono::system_clock().now().time_since_epoch()).count();
int span = static_cast<int>(tme - tms);
std::cout << "方式三:插入1000条记录耗时 " << span << " 毫秒!" << std::endl;
//以上程序输出 方式三:插入1000条记录耗时 192 毫秒!

以上可见,使用通过启动事务,逐条插入,最后提交事务的方式,插入1000条记录到SQLite数据库,需要耗时0.192秒(192毫秒)!

相关推荐
摩羯座-1856903059413 小时前
爬坑 10 年!京东店铺全量商品接口实战开发:从分页优化、SKU 关联到数据完整性闭环
linux·网络·数据库·windows·爬虫·python
编程充电站pro14 小时前
SQL 面试高频:INNER JOIN vs LEFT JOIN 怎么考?
数据库·sql
这周也會开心14 小时前
SQL-窗口函数做题总结
数据库·sql
间彧14 小时前
TiDB详解与Spring Boot实战指南
数据库
极限实验室14 小时前
Easysearch 字段'隐身'之谜:source_reuse 与 ignore_above 的陷阱解析
数据库·redis
2301_7720935614 小时前
tuchuang_后端_前端_注册登录
数据库·后端·网络协议·mysql·wireshark
武子康14 小时前
Java-141 深入浅出 MySQL Spring事务失效的常见场景与解决方案详解(3)
java·数据库·mysql·spring·性能优化·系统架构·事务
间彧14 小时前
脏读、不可重复读、幻读详解与对比
数据库
间彧15 小时前
数据库事务隔离级别详解
数据库
fwerfv34534515 小时前
使用PyTorch构建你的第一个神经网络
jvm·数据库·python