plf::list原理分析

plf::list是一个比std::list性能要好的另外一种实现,根据作者的性能测试:

293% faster insertion

57% faster erasure

17% faster iteration

77% faster sorting

70% faster reversal

91% faster remove/remove_if

63% faster unique

811% faster clear (1147900% for trivially-destructible types)

1248% faster destruction (6350% for trivially-destructible types)

20-24% faster performance overall in ordered use-case benchmarking(insertion, erasure and iteration on the fly and over time)

plf::list几乎可以完全替代std::list, 只有两个小的例外, std::list中的splice有三个接口:

  1. splice另一个list的全部node,
  2. splice自己或者其它list的一个node,
  3. splice自己或者其它list的部分nodes

对于std::list中的第一个接口, plf完全支持; std::list的第二三个接口如下 :

  1. void splice( const_iterator pos, list& other, const_iterator it ); splice一个元素, other可以是自己也可以是其他list
  2. void splice( const_iterator pos, list& other, const_iterator first, const_iterator last);splice多个元素,other可以是自己也可以是其他list

对于上面两个接口,plf::list接口中的other只能是自己(this), 因而plf::list省去了other参数, 只提供了下面两个接口,

  1. void splice(const_iterator position, const_iterator location)
  2. void splice( const_iterator pos, const_iterator first, const_iterator last);

这一限制是由plf::list本身的底层实现决定的, plf::list将多个node合并到, 后面会从实现层面作出详细分析。

plf::list的背景

在早期(1980s),CPU的速度和内存的速度几乎相等,当在数据量一定的情况下,算法的复杂度是O(1), 对比O(N)确实很有优势。

随着硬件的发展,CPU的速度越来越快,早期的"一定数据量",即使用O(N)的时间复杂度去处理,花费的时间也很少,某种程度上接近于O(1)。在这种情况下,CPU从缓存获取数据的能力(fetch data)越来越成为瓶颈,数据的局部性(data locality)越来越重要了。

std::list的insert/erase方法都是O(1)的,但是std::list中的每个元素都是一个单独的node,这就决定std::list的数据局部性不是那么好。

为了获取好的data locality,多数情况下用std::vector都是不错的选择。但是list有其固有的优点,比如插入,删除元素后其它元素的位置不变等,如何创建一个list, 使其具有良好的data locality,同时也支持O(1)的insert/erase?plf::list就是在这样的想法下诞生的。

plf::list的原理

plf::list的核心思想就是提高数据的局部性,实现方法是类vector的内存预分配。也可以说plf::list是一个自带memory pool的list.

plf::list源码分析

结合上面的示意图, plf::list源码钟最基本的数据单位是node:

对node进行管理的最基本单位是group:

一系列的group就是一个group_vector:

整个plf::list的内部数据结构就是:

plf::list用示意图就可以如下表示:

相关推荐
见过夏天11 小时前
C++ 基础入门完全指南
c++
CSharp精选营1 天前
关系型 vs 非关系型:从原理到选型,一文搞定数据库核心分类
数据结构·nosql·关系型数据库·非关系型数据库·技术选型
用户805533698032 天前
不止三件套:QObject 属性系统全关键字与运行时反射!
c++·qt
BadBadBad__AK2 天前
线段树维护区间 k 次方和
c++·数学·算法·stl
卷无止境3 天前
Eigen 库如何借助 OpenMP 加速计算
c++·后端
卷无止境3 天前
OpenMPI、MPICH 与 OpenMP:关系、核心概念与架构全解
c++·后端
郝学胜_神的一滴4 天前
CMake 30:循环语法全解|foreach_while双循环精讲、迭代技巧与实战避坑指南
c++·cmake
刘马想放假5 天前
Modbus 全栈技术解析:TCP、RTU、ASCII、RTU over TCP
数据结构·网络协议
北域码匠6 天前
冒泡排序太慢?鸡尾酒排序双向优化,原生 C# 零第三方库完整代码
数据结构·排序算法·泛型·c# 算法·鸡尾酒排序·原生 c# 开发·冒泡排序优化·嵌入式算法
卷无止境6 天前
C++ 的Eigen 库全解析
c++