C++23 新增扁平化关联容器详解

文章目录

一、引言

在 C++23 标准中,引入了四个新的关联容器:std::flat_setstd::flat_multisetstd::flat_mapstd::flat_multimap。这些容器是对底层有序随机访问容器进行包装的容器适配器,旨在为开发者提供在某些场景下比传统关联容器更高效的选择。在介绍这四个新容器之前,我们先回顾一下 C++ 中已有的关联容器。

已有关联容器回顾

  • C++98 :引入了 std::mapstd::setstd::multimapstd::multiset,这些容器基于红黑树实现,元素按键有序存储,插入、删除和查找操作的时间复杂度为 O ( l o g n ) O(log n) O(logn)。
  • C++11 :引入了 std::unordered_mapstd::unordered_setstd::unordered_multimapstd::unordered_multiset,这些容器基于哈希表实现,元素无序存储,平均情况下插入、删除和查找操作的时间复杂度为 O ( 1 ) O(1) O(1)。

新容器的引入原因

新容器的引入主要是为了在内存消耗和性能方面提供不同的选择。与传统的关联容器相比,平铺容器在某些场景下具有更好的缓存局部性,从而提高性能。

二、std::flat_set

定义与特性

std::flat_set 是一个类似于 std::set 的容器,但它使用扁平化存储的唯一键集合。它的底层实现使用排序的连续存储(通常是 std::vector 或类似结构),而不是树结构。这使得元素在内存中是连续存储的,具有以下特点:

  • 查找速度快 :查找操作使用二分查找,时间复杂度为 O ( l o g n ) O(log n) O(logn)。由于内存连续,缓存命中率高,总体查找速度比 std::set 快。
  • 插入和删除较慢 :插入和删除操作通常需要对数组中的元素进行整体移动,尤其在不支持移动构造时,时间复杂度为 O ( n ) O(n) O(n)。
  • 迭代速度快 :由于内存局部性,迭代速度比 std::set 快。
  • 内存占用小:相对于平衡二叉树,减少了节点指针的维护,从而节省了内存空间。

代码示例

cpp 复制代码
#include <flat_set>
#include <iostream>

int main() {
    std::flat_set<int> primes{2, 3, 5, 7, 11};

    // 插入元素
    primes.insert(13);

    // 检查存在性
    if (primes.contains(7)) {
        std::cout << "7 is a prime number" << std::endl;
    }

    // 范围查询
    auto [begin, end] = primes.equal_range(5);
    for (auto it = begin; it != end; ++it) {
        std::cout << *it << " ";
    }
    std::cout << std::endl;

    return 0;
}

适用场景

  • 需要频繁查找但较少插入/删除:由于查找速度快,插入和删除操作相对较慢,适合用于需要频繁查找元素的场景。
  • 需要快速迭代:内存连续的特性使得迭代速度快,适合需要快速遍历元素的场景。
  • 内存受限环境:内存占用小的特点使得它在内存受限的环境中更具优势。

三、std::flat_multiset

定义与特性

std::flat_multiset 类似于 std::flat_set,但允许存储多个具有相同键的元素。它同样使用排序的连续存储,具有与 std::flat_set 类似的性能特点:

  • 查找速度快 :查找操作使用二分查找,时间复杂度为 O ( l o g n ) O(log n) O(logn)。
  • 插入和删除较慢 :插入和删除操作通常需要对数组中的元素进行整体移动,时间复杂度为 O ( n ) O(n) O(n)。
  • 迭代速度快:由于内存局部性,迭代速度快。
  • 内存占用小:相对于平衡二叉树,减少了节点指针的维护,从而节省了内存空间。

代码示例

cpp 复制代码
#include <flat_set>
#include <iostream>

int main() {
    std::flat_multiset<int> numbers{1, 2, 2, 3, 3, 3};

    // 插入元素
    numbers.insert(4);

    // 查找元素
    auto range = numbers.equal_range(2);
    for (auto it = range.first; it != range.second; ++it) {
        std::cout << *it << " ";
    }
    std::cout << std::endl;

    return 0;
}

适用场景

  • 需要存储重复元素且需要快速查找 :与 std::flat_set 类似,但允许存储重复元素,适合需要存储重复元素且需要快速查找的场景。
  • 需要快速迭代:内存连续的特性使得迭代速度快,适合需要快速遍历元素的场景。
  • 内存受限环境:内存占用小的特点使得它在内存受限的环境中更具优势。

四、std::flat_map

定义与特性

std::flat_map 是一个类似于 std::map 的容器,但它使用扁平化存储的键值对容器。它的底层实现使用两个有序数组,一个存储键,另一个存储值,具有以下特点:

  • 查找速度快 :查找操作使用二分查找,时间复杂度为 O ( l o g n ) O(log n) O(logn)。由于内存连续,缓存命中率高,总体查找速度比 std::map 快。
  • 插入和删除较慢 :插入和删除操作通常需要对数组中的元素进行整体移动,尤其在不支持移动构造时,时间复杂度为 O ( n ) O(n) O(n)。
  • 迭代速度快 :由于内存局部性,迭代速度比 std::map 快。
  • 内存占用小:相对于平衡二叉树,减少了节点指针的维护,从而节省了内存空间。
  • 使用随机访问迭代器 :与 std::map 使用双向迭代器不同,std::flat_map 使用随机访问迭代器。
  • 迭代器不稳定:插入和删除元素时迭代器会失效。
  • 无法存储不可复制和不可移动的值类型:由于需要对元素进行移动和复制,无法存储不可复制和不可移动的值类型。
  • 异常安全性弱:在删除和插入时移动值可能会抛出异常。

代码示例

cpp 复制代码
#include <flat_map>
#include <iostream>
#include <string>

int main() {
    std::flat_map<std::string, int> ages{
        {"Alice", 30},
        {"Bob", 25},
        {"Charlie", 35}
    };

    // 插入元素(可能触发排序和移动)
    ages.insert({"David", 28});

    // 查找元素
    if (auto it = ages.find("Alice"); it != ages.end()) {
        std::cout << "Alice is " << it->second << " years old" << std::endl;
    }

    // 迭代
    for (const auto& [name, age] : ages) {
        std::cout << name << ": " << age << std::endl;
    }

    return 0;
}

适用场景

  • 需要频繁查找但较少插入/删除:由于查找速度快,插入和删除操作相对较慢,适合用于需要频繁查找元素的场景。
  • 需要快速迭代:内存连续的特性使得迭代速度快,适合需要快速遍历元素的场景。
  • 内存受限环境:内存占用小的特点使得它在内存受限的环境中更具优势。

五、std::flat_multimap

定义与特性

std::flat_multimap 类似于 std::flat_map,但允许存储多个具有相同键的键值对。它同样使用排序的连续存储,具有与 std::flat_map 类似的性能特点:

  • 查找速度快 :查找操作使用二分查找,时间复杂度为 O ( l o g n ) O(log n) O(logn)。
  • 插入和删除较慢 :插入和删除操作通常需要对数组中的元素进行整体移动,时间复杂度为 O ( n ) O(n) O(n)。
  • 迭代速度快:由于内存局部性,迭代速度快。
  • 内存占用小:相对于平衡二叉树,减少了节点指针的维护,从而节省了内存空间。

代码示例

cpp 复制代码
#include <flat_map>
#include <iostream>
#include <string>

int main() {
    std::flat_multimap<std::string, int> scores{
        {"Alice", 80},
        {"Bob", 90},
        {"Alice", 85}
    };

    // 插入元素
    scores.insert({"Charlie", 75});

    // 查找元素
    auto range = scores.equal_range("Alice");
    for (auto it = range.first; it != range.second; ++it) {
        std::cout << it->first << ": " << it->second << std::endl;
    }

    return 0;
}

适用场景

  • 需要存储重复键的键值对且需要快速查找 :与 std::flat_map 类似,但允许存储重复键的键值对,适合需要存储重复键的键值对且需要快速查找的场景。
  • 需要快速迭代:内存连续的特性使得迭代速度快,适合需要快速遍历元素的场景。
  • 内存受限环境:内存占用小的特点使得它在内存受限的环境中更具优势。

六、与其他容器的比较

std::setstd::multiset 的比较

特性 std::set/std::multiset std::flat_set/std::flat_multiset
底层实现 红黑树 排序的连续存储(通常是 std::vector
查找速度 O ( l o g n ) O(log n) O(logn) O ( l o g n ) O(log n) O(logn),但缓存友好,总体速度更快
插入和删除速度 O ( l o g n ) O(log n) O(logn) O ( n ) O(n) O(n)
迭代速度 较慢 较快
内存占用 较大 较小
迭代器稳定性 稳定 不稳定

std::mapstd::multimap 的比较

特性 std::map/std::multimap std::flat_map/std::flat_multimap
底层实现 红黑树 排序的连续存储(通常是 std::vector
查找速度 O ( l o g n ) O(log n) O(logn) O ( l o g n ) O(log n) O(logn),但缓存友好,总体速度更快
插入和删除速度 O ( l o g n ) O(log n) O(logn) O ( n ) O(n) O(n)
迭代速度 较慢 较快
内存占用 较大 较小
迭代器稳定性 稳定 不稳定
迭代器类型 双向迭代器 随机访问迭代器

七、总结

C++23 引入的 std::flat_setstd::flat_multisetstd::flat_mapstd::flat_multimap 为开发者提供了在某些场景下比传统关联容器更高效的选择。这些容器在查找和迭代操作上具有更好的性能,同时内存占用更小。然而,它们的插入和删除操作相对较慢,迭代器也不稳定。因此,在选择使用这些容器时,需要根据具体的应用场景进行权衡。如果需要频繁进行查找和迭代操作,且插入和删除操作较少,那么这些平铺容器是一个不错的选择。

相关推荐
北漂老男孩1 分钟前
Spring 框架核心机制深度解析【AI模型互搏生成】
java·后端·spring
asom2210 分钟前
Java 08集合
java·开发语言
独行soc29 分钟前
2025年渗透测试面试题总结-安恒[实习]安全工程师(题目+回答)
运维·开发语言·经验分享·网络安全·面试·渗透测试·php
kokotao30 分钟前
使用Java实现Navicat密码的加密与解密
java·开发语言·数据库·mysql
c无序32 分钟前
【Go-2】基本语法与数据类型
开发语言·后端·golang
快乐肚皮38 分钟前
深入浅出:Spring Cloud Gateway 扩展点实践指南
java·linux·运维
胡小禾43 分钟前
ES常识9:如何实现同义词映射(搜索)
java·大数据·elasticsearch
傻傻虎虎1 小时前
【QT】ModbusTCP读写寄存器类封装
开发语言·数据库·qt