STL 提供的容器可以有多快?(下)「榨干最后一滴」

以下内容为本人的学习笔记,如需要转载,请声明原文链接 微信公众号「ENG八戒」mp.weixin.qq.com/s/QWgA97TDM...

查表的消耗

某些场景下需要用到大量的 (string, X) 键值对来存储数据,标准库提供了关联容器 std::map 来解决键值对的存储需求。

由于 std::map 负责管理插入元素(键值对)的存储顺序,访问元素时需要比较键,比如 (string, X) 中的 string。键的比较依赖操作符 <,操作符的执行过程直接影响查表的效率,也就影响访问效率。

std::map 内部数据结构采用红黑树,假设 std::map<std::string, int> 中包含 N 个元素,查找一个元素的最多比较次数等于树的高度。对于一个高度均衡的树,平均高度可以认为是 log2(N),其中 N 是树中的元素数量。

可见元素数量比较少,而且比较操作符 < 运算代价较小,同时无法构造出良好的哈希函数的情况下,std::map 是非常合适的容器。相反,元素数量比较多,同时如果能提供良好的哈希函数的情况下,std::unordered_map 更合适一些。

如果想要提升键的比较效率,可以尝试用 (const char *, X) 替换 (string, X)。针对 C 风格的字符串指针,调用比较操作符 < 运算不会执行字典序比较,所以执行速度更快,容器占用空间也相对小。麻烦的是,访问元素时,需要自行确保其以正确的字典序方式进行比较。当然,使用指针可能带来其他副作用,如访问内存地址越界、泄漏、未初始化等等。

除了键对访问效率的限制之外,键值对的值 X 如果比较占空间,在复制时同样会拖慢效率。处理方法可以参考之前提到的策略:指针、智能指针以及写时复制等等策略。

如果你对「写时复制」的概念不是很清楚,可以查阅一下笔者之前的文章《C++ 代码性能空间之极限拉扯:「COW」 真乃神助攻》,本文末尾有跳转阅读链接。

侵入式列表

在对系统效率极为苛刻的条件下,有的开发者需要实现更高效的自定义侵入式列表,榨干最后一滴性能。标准库提供的容器链表虽然在空间和效率上已大为改善,但是对性能的极致追求决定了特定场景的自定义链表还有发挥的空间。

比如:

  1. 标准库提供的链表容器,需要额外的内存开销来存储指向前后节点的信息。如果容器插入大量小对象,会产生内存碎片,对内存的利用率不足。

  2. 即使是最保守的内存分配和释放,比如基本的插入和删除节点的动作,仍然会占用 CPU 资源,何况是频繁为节点分配和释放内存,会大为拖慢链表容器的执行效率。

Intrusive lists(侵入式列表)是一种特殊的数据结构实现方式,不同于传统的链表。它不要求列表负责分配和释放节点的存储空间,而是要求用户自己管理被插入的节点存储空间,

另外,节点自身必须存储其在列表中的位置信息。比如,双向侵入式列表,节点结构中包含了指向前后节点的指针,而单向侵入式列表,节点结构中包含有一个指向下一个节点的指针。

这种列表被称为"侵入式",是因为存储在列表中节点对象的内部结构包含了列表的相关信息(链接信息),而且节点内存必须由用户管理,不能像标准库提供的链表那样为每个节点单独分配内存。

下面来看看如何定义侵入式链表容器的节点

arduino 复制代码
// 链表容器的链接信息结构
template <typename T>
struct IntrusiveListNodeBase
{
    T* prev;
    T* next;
};

// 要插入链表的用户对象
struct UserObject
{
    IntrusiveListNodeBase<UserObject> list_node;
    // 其它成员,比如数据...
};

由于插入容器列表的用户对象类型是可变的,在设计链表容器的链接信息结构时需要传入可变的类型参数,所以使用模板类。在 C++ 里,结构体其实是特殊的类。

然后,实现一个简单的侵入式链表容器,同样使用模板类的形式。容器应该提供基本的接口供用户使用,比如插入、查询、删除等

ini 复制代码
template <typename T>
class IntrusiveList
{
public:
    // 在链表前插入节点
    void push_front(T* item)
    {
        auto& node = item->list_node;
        node.prev = nullptr;
        node.next = head_;
        if (head_)
            head_->list_node.prev = item;
        head_ = item;
    }

    // 擦除节点
    void erase(T* item)
    {
        auto& node = item->list_node;
        if (node.prev)
            node.prev->list_node.next = node.next;
        else
            head_ = node.next;

        if (node.next)
            node.next->list_node.prev = node.prev;

        // 清理节点指针,防止悬挂指针
        node.prev = nullptr;
        node.next = nullptr;
    }

    // 查询列表当前节点数量
    int num_of_list()
    {
        T* head = head_;
        int num = 0;
        if (head == nullptr) {
            return num;
        }

        num = 1;
        while (head->list_node.next != nullptr) {
            ++ num;
            head = head->list_node.next;
        }
        return num;
    }

    // ...

private:
    T* head_ = nullptr;
};

最后看看链表的使用情况,对列表插入多个节点和移除部分节点后,查询剩余的节点数量

c 复制代码
int main()
{
    UserObject obj1, obj2;
    IntrusiveList<UserObject> list;

    // 将对象插入列表
    list.push_front(&obj1);
    list.push_front(&obj2);
    // 将对象移出列表
    list.erase(&obj1);
    // 查询列表当前节点数量
    std::cout << "there is "
        << list.num_of_list()
        << " elements"
        << std::endl;
    // ...
    return 0;
}

用户负责分配和释放插入侵入式列表的对象资源,上面的演示代码里,插入列表的对象资源分配在栈内,所以用户无须特意手动释放。而且,插入节点的过程无需任何的复制拷贝,删除节点的过程也无需释放任何资源,所以再频繁的插入删除操作都是极快的!

但是,还是要提醒一下,这种侵入式的链表容器不应该是首选的工具,标准库提供的容器已经可以应付绝大部分的需求,理应作为开发首选。现在绝大部分的生产环境并不依赖如此苛刻的精打细算,过分开发反而是高昂的成本。


全文写到这里就结束了,如果各位同学朋友有什么疑问欢迎联系我交流。另外,八戒有自己的技术圈交流群,如果读者朋友有兴趣入群交流技术问题,欢迎联系我。下拉到文章底部有我的联系方式!

最后,非常感激各位朋友的点 「赞」 和点击 「在看」,谢谢!

相关推荐
起名字真南2 分钟前
【OJ题解】C++实现字符串大数相乘:无BigInteger库的字符串乘积解决方案
开发语言·c++·leetcode
少年负剑去2 分钟前
第十五届蓝桥杯C/C++B组题解——数字接龙
c语言·c++·蓝桥杯
cleveryuoyuo3 分钟前
AVL树的旋转
c++
神仙别闹26 分钟前
基于MFC实现的赛车游戏
c++·游戏·mfc
小c君tt33 分钟前
MFC中 error C2440错误分析及解决方法
c++·mfc
木向1 小时前
leetcode92:反转链表||
数据结构·c++·算法·leetcode·链表
阿阿越1 小时前
算法每日练 -- 双指针篇(持续更新中)
数据结构·c++·算法
hunandede1 小时前
FFmpeg存放压缩后的音视频数据的结构体:AVPacket简介,结构体,函数
c++
hunandede2 小时前
FFmpeg 4.3 音视频-多路H265监控录放C++开发十三:将AVFrame转换成AVPacket。视频编码,AVPacket 重要函数,结构体成员学习
c++·ffmpeg·音视频
奋斗的小花生8 小时前
c++ 多态性
开发语言·c++