SQLite架构

介绍

本文档描述了 SQLite 库的架构。 这里的信息对那些想要了解或 修改 SQLite 的内部工作原理。

上图显示了 SQLite 的主要组件 以及它们如何互作。下面的文字 解释了各个组件的作用。

概述

SQLite 的工作原理是将 SQL 文本编译成字节码,然后运行 使用虚拟机的字节码。

sqlite3_prepare_v2() 和相关接口充当编译器 用于将 SQL 文本转换为字节码。sqlite3_stmt对象是 单个字节码程序的容器,该程序实现单个 SQL 语句。sqlite3_step() 接口传递一个字节码程序 到虚拟机中,并运行程序,直到它完成, 或形成一行要返回的结果,或遇到致命错误,或被中断

接口

大部分 C 语言接口都可以在源代码中找到 文件 main.clegacy.cvdbeapi.c,尽管有些例程是 分散在他们可以访问数据的其他文件中 具有文件范围的结构。 sqlite3_get_table() 例程在 table.c 中实现。 sqlite3_mprintf() 例程位于 printf.c 中。 sqlite3_complete() 接口位于 complete.c 中。 TCL 接口tclsqlite.c 实现。

为避免名称冲突,所有外部 SQLite 库中的符号以前缀 sqlite3 开头。 那些供外部使用的符号(换句话说, 构成 SQLite API 的那些符号)添加下划线,以及 因此,从sqlite3_ 开始。扩展 API 有时会将 下划线前的扩展名;例如:sqlite3rbu_sqlite3session_

分词器

当要计算包含 SQL 语句的字符串时,它是 首先发送到分词器。 分词器中断 将 SQL 文本转换为标记并传递这些标记 一个一个地发送到解析器。分词器是手工编码的 文件 tokenize.c。

请注意,在此设计中,分词器调用解析器。人 熟悉 YACC 和 BISON 的人可能习惯了做事 反过来------让解析器调用分词器。拥有 不过,分词器调用解析器更好,因为它可以 线程安全,运行速度更快。

解析器

解析器根据 他们的背景。SQLite 的解析器是使用 Lemon 解析器生成器生成的。 Lemon 与 YACC/BISON 的工作相同,但它使用 不易出错的不同输入语法。 Lemon 还生成一个可重入且线程安全的解析器。 Lemon 定义了非终端析构函数的概念,因此 当遇到语法错误时,它不会泄漏内存。 驱动 Lemon 并定义 SQL 语言的语法文件 SQLite 理解的可以在 parse.y 中找到。

因为 Lemon 是一个通常不会在开发机器上找到的程序,即 Lemon 的完整源代码(仅一个 C 文件)包含在 SQLite 发行版。

代码生成器

解析器将标记组装成解析树后, 代码生成器运行以分析解析树并生成执行 SQL 语句工作的字节码准备好的语句对象是此字节码的容器。 代码生成器中有许多文件,包括:attach.cauth.cbuild.cdelete.cexpr.cinsert.cpragma.cselect.ctrigger.cupdate.cvacuum.cwhere.cwherecode.cwhereexpr.c。 在这些文件中,大多数严肃的魔法都发生了。expr.c 处理表达式的代码生成。where*.c 处理 WHERE 子句的代码生成 SELECT、UPDATE 和 DELETE 语句。文件 attach.cdelete.cinsert.cselect.ctrigger.c update.cvacuum.c 处理代码生成 对于具有相同名称的 SQL 语句。(这些文件中的每一个都调用例程 在 expr.cwhere.c 中。所有其他 SQL 语句是从 build.c 中编码的。 auth.c 文件实现了 sqlite3_set_authorizer() 的功能。

代码生成器,尤其是 where*.cselect.c 中的逻辑,有时称为查询规划器。对于任何特定的 SQL 语句,可能有 数百、数千或数百万种不同的算法进行计算 答案。查询规划器是一种 AI,它致力于选择 从这数百万个选择中获得最佳算法。

字节码引擎

代码生成器创建的字节码程序由 虚拟机。

虚拟机本身完全包含在单个 源文件 vdbe.cvdbe.h 头文件定义了一个接口 在虚拟机与 SQLite 库的其余部分和 vdbeInt.h 之间,vdbeInt.h 定义了结构和接口 对虚拟机本身来说是专用的。 其他各种 vdbe*.c 文件是虚拟机的帮助程序。 vdbeaux.c 文件包含虚拟 计算机和接口模块,由库的其余部分用于 构建 VM 程序。vdbeapi.c 文件包含外部 与虚拟机的接口,例如 sqlite3_bind_int()sqlite3_step()。个人价值观 (字符串、整数、浮点数和 BLOB)被存储 在名为"Mem"的内部对象中,该对象由 vdbemem.c 实现。

SQLite 使用 C 语言例程的回调实现 SQL 函数。 甚至内置的 SQL 函数也是这样实现的。大多数 内置的 SQL 函数(例如:abs()count()substr() 等)可以在 func.c 源代码中找到 文件。 日期和时间转换函数位于 date.c 中。 实现了一些函数,例如 coalesce()typeof() 作为字节码直接由代码生成器。

B树

SQLite 数据库使用 B 树实现在磁盘上维护在 btree.c 源文件中找到。单独的 B 树用于数据库中的每个表和每个索引。所有 B 树都存储在同一个磁盘文件。文件格式详细信息稳定且定义明确,并且保证今后兼容。

B-tree 子系统和 SQLite 库其余部分的接口由头文件 btree.h 定义。

页面缓存

B 树模块从固定大小的磁盘请求信息 页面。 默认page_size为 4096 字节,但可以是两个介于 512 和 65536 字节之间的任何幂。页面缓存负责读取、写入和缓存这些页面。页面缓存还提供回滚和原子提交抽象并负责数据库文件的锁定。 这 B-tree 驱动程序从页面缓存中请求特定页面并通知页面缓存在想要修改页面或提交或回滚时 变化。 页面缓存处理所有混乱的细节,以确保请求得到快速、安全和高效的处理。

主页面缓存实现位于 pager.c 文件中。WAL 模式逻辑位于单独的 wal.c 文件中。内存缓存由 pcache.cpcache1.c 文件实现。页面缓存子系统之间的接口和 SQLite 的其余部分由头文件 pager.h 定义。

操作系统接口

为了提供跨作系统的可移植性,SQLite 使用一个名为 VFS 的抽象对象。每个 VFS 都提供方法用于打开、读取、写入和关闭磁盘上的文件,以及用于其他特定于作系统的任务,例如查找当前时间或获取随机性以初始化内置的伪随机数生成器。SQLite 目前为 unix(在 os_unix.c 文件中)和 Windows(在 os_win.c 文件中)提供 VFS。

公共例程

内存分配、无大小写字符串比较例程、 便携式文本到数字转换例程和其他实用程序 位于 util.c 中。 解析器使用的符号表由找到的哈希表维护 在 hash.c 中。utf.c 源文件包含 Unicode 转换子例程。 SQLite 有自己的 printf() 私有实现( 一些扩展)和它自己的 random.c 中的伪随机数生成器 (PRNG)

测试代码

源代码树的"src/"文件夹中名称以 test 开头的文件仅用于测试,不包含在标准中 构建库。

相关推荐
Elastic 中国社区官方博客1 小时前
在 Elasticsearch 中使用 Mistral Chat completions 进行上下文工程
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
编程爱好者熊浪3 小时前
两次连接池泄露的BUG
java·数据库
TDengine (老段)5 小时前
TDengine 字符串函数 CHAR 用户手册
java·大数据·数据库·物联网·时序数据库·tdengine·涛思数据
qq7422349845 小时前
Python操作数据库之pyodbc
开发语言·数据库·python
姚远Oracle ACE5 小时前
Oracle 如何计算 AWR 报告中的 Sessions 数量
数据库·oracle
Dxy12393102166 小时前
MySQL的SUBSTRING函数详解与应用
数据库·mysql
码力引擎6 小时前
【零基础学MySQL】第十二章:DCL详解
数据库·mysql·1024程序员节
杨云龙UP6 小时前
【MySQL迁移】MySQL数据库迁移实战(利用mysqldump从Windows 5.7迁至Linux 8.0)
linux·运维·数据库·mysql·mssql
l1t6 小时前
利用DeepSeek辅助修改luadbi-duckdb读取DuckDB decimal数据类型
c语言·数据库·单元测试·lua·duckdb
安当加密6 小时前
Nacos配置安全治理:把数据库密码从YAML里请出去
数据库·安全