DeepSeek总结的数据库性能教学文章

数据库查询性能的演进：从脚本到并行优化

作者：Torsten Grust
时间：2025/26年冬季学期
单位：德国图宾根大学

数据库管理系统（DBMS）通过充分利用现代计算机架构中的CPU多线程、内存层次结构（DRAM、缓存）及SSD等存储设备，实现了高效的数据处理。即便是最微小的性能优化，在面对数百万行数据处理时，也会产生显著的放大效应。

本文以一个简单的查询任务为切入点，逐步展示从脚本语言到手工优化的C代码，再到现代DBMS（DuckDB）在性能上的巨大差异。该任务为：读取TPC-H基准测试中的lineitem表（约720MB），并对第五列quantity字段求和。

在开始优化之前，作者首先测定了硬件的理论性能极限：

这些数值是基于I/O带宽的理想情况，忽略了CPU处理开销，作为后续优化的参考上限。

bash 复制代码

awk -F '|' '{sum += $5} END {print sum}' lineitem.csv

逐行读取、拆分、类型转换。

使用标准C库逐行解析。

使用mmap()一次性将文件映射到内存，避免逐行系统调用。

使用64位字块并行查找换行符，利用位运算宏HAS_NL()。

将文件按换行符划分为12个分区，每个线程独立求和。

作者使用DuckDB对同一数据执行SQL查询：

sql 复制代码

SELECT sum(l_quantity) FROM read_csv('lineitem.csv');

sql 复制代码

SELECT sum(l_quantity) FROM lineitem;

50年过去了，关系模型的查询优化依然是活跃的研究领域。

即使是个人笔记本电脑，也能实现每秒数GB的数据处理能力。现代DBMS的性能并非依赖"大铁器"或集群，而是通过对硬件特性的深度理解和精细的性能工程实现的。