C++ std::Set<std::pair>

1) std::set 的三个关键特性

  • 元素自动排序std::set 始终按严格弱序 (默认 std::less<Key> 的字典序)维持有序,常见操作(插入、查找、上下界)复杂度均为 O(log N)
  • 元素不允许重复 :比较器认为"等价"的元素不能共存(即 !(a<b) && !(b<a) 为真时视为等价)。
  • 基于红黑树实现 :标准库通常采用红黑树;因此"有序 + 查找高效 "是它相对 unordered_set 的显著特征。

2) 关于比较:Timestampstd::unique_ptr<int> 能否比较?

  • Timestamp :你给出的成员是 private int secondsFromEpoch。要参与排序,必须为 Timestamp 提供可用的严格弱序比较 (通常实现 operator< 或在比较器内访问一个 getter())。

  • std::unique_ptr<int>

    • 标准提供了与同类 unique_ptr关系运算符<、<=、>、>=、==、!=),其比较语义是按底层指针地址 比较(实现上等价于 std::less<int*>{}(p.get(), q.get()))。
    • 注意 :这不是按指向的"整数值"比较,而是按地址。如果你的业务语义是"同时间戳 + 指针指向的值也相等才算相等/有序",地址比较可能不符合预期。
    • 结论:可以比较,但"比较的是地址而非内容"。

字典序std::pair<A,B> 的默认 < 比较是先比较 first ,若相等再比较 second 。因此在 std::set<std::pair<Timestamp, std::unique_ptr<int>>> 中:

  1. 先比较 Timestamp
  2. Timestamp 相等时,再比较 unique_ptr<int>地址

3) 自定义透明比较器(heterogeneous lookup)

直接用 pair<Timestamp, unique_ptr<int>> 做键会遇到查找难题

  • 不能 构造一个临时 unique_ptr<int> 作为查找键的第二分量(会产生错误的所有权 ,临时对象析构时会delete 它指向的地址,造成双重释放风险)。
  • 正确姿势是用透明比较器 支持"用 (Timestamp, const int*) 这类异质键 进行查找",从而无需构造 unique_ptr

透明比较器(具备 using is_transparent = void;)允许 set.find / erase / lower_bound 等直接用可比较但类型不同 的键(如 const int*)进行 O(log N) 查找。


4) CRUD 规范做法(C++17+)

下述代码块分别演示 Create/Read/Update/Delete。请先看类型与比较器。

cpp 复制代码
#include <set>
#include <memory>
#include <utility>
#include <optional>
#include <iostream>

// ========== 1) 可排序的 Timestamp ==========
class Timestamp {
    int secondsFromEpoch_; // 私有
public:
    explicit Timestamp(int s = 0) : secondsFromEpoch_(s) {}
    int seconds() const noexcept { return secondsFromEpoch_; }
    // 定义严格弱序(仅按秒比较)
    friend bool operator<(const Timestamp& a, const Timestamp& b) noexcept {
        return a.secondsFromEpoch_ < b.secondsFromEpoch_;
    }
};

// 方便书写
using Key = std::pair<Timestamp, std::unique_ptr<int>>;

// ========== 2) 透明比较器:支持 pair<Timestamp, unique_ptr<int>>
// 以及 (Timestamp, const int*) 这种异质键的比较与查找 ==========
struct PairCmp {
    using is_transparent = void; // 启用异质查找

    // 基本:pair vs pair(按字典序:先时间戳,再指针地址)
    bool operator()(const Key& a, const Key& b) const noexcept {
        if (a.first < b.first) return true;
        if (b.first < a.first) return false;
        return std::less<const int*>{}(a.second.get(), b.second.get());
    }

    // 异质:pair vs (Timestamp, const int*)
    bool operator()(const Key& a, const std::pair<Timestamp, const int*>& b) const noexcept {
        if (a.first < b.first) return true;
        if (b.first < a.first) return false;
        return std::less<const int*>{}(a.second.get(), b.second);
    }
    bool operator()(const std::pair<Timestamp, const int*>& a, const Key& b) const noexcept {
        if (a.first < b.first) return true;
        if (b.first < a.first) return false;
        return std::less<const int*>{}(a.second, b.second.get());
    }

    // 也可追加只按 Timestamp 的异质比较(用于范围查询)
    bool operator()(const Key& a, const Timestamp& t) const noexcept {
        return a.first < t;
    }
    bool operator()(const Timestamp& t, const Key& b) const noexcept {
        return t < b.first;
    }
};

using PairSet = std::set<Key, PairCmp>;

A. Create(插入)

  • std::set节点容器 ,可无拷贝插入仅移动类型 (如 unique_ptr)。
  • emplace / insert,传右值/用 std::make_unique
cpp 复制代码
PairSet s;

// 1) 直接 emplace(推荐)
s.emplace(Timestamp{100}, std::make_unique<int>(42));
s.emplace(Timestamp{100}, std::make_unique<int>(7));   // 与上一个可共存:时间戳相同但地址不同
s.emplace(Timestamp{120}, std::make_unique<int>(99));

// 2) 先构造 Key 再 move
Key k{ Timestamp{130}, std::make_unique<int>(123) };
s.insert(std::move(k)); // k.second 置空

要点

  • 如果你希望"相同 Timestamp 只允许一条记录",就不要把 unique_ptr 纳入比较 ;而应改用"仅比较 Timestamp"的比较器(见 §7 变体方案)。

B. Read(查询/遍历)

1) 按(Timestamp, 指针地址)精确查找

利用透明比较器 ,避免构造临时 unique_ptr

cpp 复制代码
Timestamp t{100};
const int* addr = /* 已知的底层指针地址,如 it->second.get() */;
auto it = s.find(std::pair<Timestamp, const int*>{t, addr});
if (it != s.end()) {
    std::cout << "found value=" << *(it->second) << "\n";
}

2) 按时间戳做范围/等值查找

cpp 复制代码
// 所有 timestamp == 100 的区间:
auto rng = s.equal_range(Timestamp{100}); // 依赖我们在比较器中提供的 (Key, Timestamp) 重载
for (auto it = rng.first; it != rng.second; ++it) {
    // 这些元素的 it->first.seconds() 都是 100
}

// 所有 timestamp 在 [100, 130):
for (auto it = s.lower_bound(Timestamp{100}); it != s.lower_bound(Timestamp{130}); ++it) {
    // ...
}

3) 遍历(有序)

cpp 复制代码
for (const auto& [ts, ptr] : s) {
    std::cout << ts.seconds() << " -> " << (ptr ? *ptr : -1) << "\n";
}

C. Update(更新)

重要原则std::set 中的元素作为"键"不可就地修改其影响排序的部分 (包括 Timestampunique_ptr 的地址)。否则会破坏红黑树不变量。
正确做法 :使用 node handle(C++17)进行"摘除-修改-再插入"。

1) 修改 Timestamp 或替换 unique_ptr(地址会变)

cpp 复制代码
// 找到一个元素
auto it = s.lower_bound(Timestamp{100});
if (it != s.end() && it->first.seconds() == 100) {
    // 1) extract 节点,容器不再管理平衡关系中的该节点
    auto nh = s.extract(it);       // node_handle,拥有该 pair 的完整所有权
    // 2) 修改 key 内容(注意:任何影响排序的字段都只能在 node 中修改)
    nh.value().first = Timestamp{105};                  // 改时间戳
    nh.value().second = std::make_unique<int>(555);     // 新指针(地址变化)
    // 3) 重新插入
    auto [pos, ok] = s.insert(std::move(nh));
    // ok==false 表示与现有元素等价(违反唯一性),插入失败
}

2) 仅更新指向对象的"值"(不改变地址)

如果你不更换 unique_ptr 本身,只是修改它指向的 int 的数值 (地址不变),就不会影响排序,可在常量迭代器上做"逻辑修改"前需要去除 const:

  • 标准不允许通过 const_iterator 直接修改元素;但你可以用 const_cast<int&>(*ptr) 或将迭代器转换为非常量迭代器(C++23 提供了 const_iteratoriteratormutable_iterator 转换;更通用办法是先通过查找得到非 const 迭代器)。

简化起见,建议:提取 node 后修改再插回,语义最清晰。


D. Delete(删除)

cpp 复制代码
// 1) 迭代器删除
if (!s.empty()) {
    s.erase(s.begin());
}

// 2) 按异质键删除(Timestamp + 地址)
Timestamp t{100};
const int* addr = /*...*/;
s.erase(std::pair<Timestamp, const int*>{t, addr});

// 3) 按时间戳范围删除
s.erase(s.lower_bound(Timestamp{100}), s.lower_bound(Timestamp{130}));

5) 典型陷阱与建议

  1. 临时 unique_ptr 作为查找键 :千万不要用 find({ts, std::unique_ptr<int>(raw)}) 查找,临时 unique_ptr 析构时会 delete raw,导致双重释放 。请使用透明比较器 + 原始指针地址的异质查找。

  2. 修改键值破坏有序性 :在容器中直接改 Timestamp 或把 unique_ptr 换成另一块地址,都会破坏树的排序假设。务必用 extract→修改→insert

  3. 语义核对unique_ptr 的比较是按地址 而非按"指向内容"。如果你想让"同一 Timestamp + 相同内容 (例如 *ptr)才算相等,需要自定义比较器 改成按 *ptr 值比较(并处理空指针)。

  4. 标准版本

    • C++17 起 :有 node_handle、更明确的对仅移动键 (如 unique_ptr)的支持。强烈建议使用 C++17+。
    • 透明比较器 用法在 C++14 就可行(is_transparent 习惯用法),但与 node handle 结合最顺畅的是 C++17+。

6) 小结(要点清单)

  • std::set自动排序、唯一性、红黑树、O(log N)
  • pair<Timestamp, unique_ptr<int>> 的默认字典序比较可用 :先 Timestamp,再指针地址
  • 由于 unique_ptr仅移动 类型:用 emplace/insert(std::move)查找 应使用透明比较器 + 原始指针地址异质查找不要 构造临时 unique_ptr
  • 更新键 请走 extract→修改→insert修改指向对象内容不改变地址,一般不破坏排序。
  • 若你的业务语义不是"按地址",请自定义比较器 (例如比较 *ptr 的值,或仅比较 Timestamp)。
  • 建议 C++17+ (为 node_handle 与仅移动键的良好支持)。

完整最小示例(可直接参考)

cpp 复制代码
#include <set>
#include <memory>
#include <utility>
#include <iostream>

class Timestamp {
    int secondsFromEpoch_;
public:
    explicit Timestamp(int s = 0) : secondsFromEpoch_(s) {}
    int seconds() const noexcept { return secondsFromEpoch_; }
    friend bool operator<(const Timestamp& a, const Timestamp& b) noexcept {
        return a.secondsFromEpoch_ < b.secondsFromEpoch_;
    }
};

using Key = std::pair<Timestamp, std::unique_ptr<int>>;

struct PairCmp {
    using is_transparent = void;

    bool operator()(const Key& a, const Key& b) const noexcept {
        if (a.first < b.first) return true;
        if (b.first < a.first) return false;
        return std::less<const int*>{}(a.second.get(), b.second.get());
    }
    bool operator()(const Key& a, const std::pair<Timestamp, const int*>& b) const noexcept {
        if (a.first < b.first) return true;
        if (b.first < a.first) return false;
        return std::less<const int*>{}(a.second.get(), b.second);
    }
    bool operator()(const std::pair<Timestamp, const int*>& a, const Key& b) const noexcept {
        if (a.first < b.first) return true;
        if (b.first < a.first) return false;
        return std::less<const int*>{}(a.second, b.second.get());
    }
    bool operator()(const Key& a, const Timestamp& t) const noexcept { return a.first < t; }
    bool operator()(const Timestamp& t, const Key& b) const noexcept { return t < b.first; }
};

using PairSet = std::set<Key, PairCmp>;

int main() {
    PairSet s;

    // Create
    auto [it1, ok1] = s.emplace(Timestamp{100}, std::make_unique<int>(42));
    auto [it2, ok2] = s.emplace(Timestamp{100}, std::make_unique<int>(7));
    s.emplace(Timestamp{120}, std::make_unique<int>(99));

    // Read: find by (Timestamp, raw pointer)
    const int* addr = it1->second.get();
    auto it = s.find(std::pair<Timestamp, const int*>{Timestamp{100}, addr});
    if (it != s.end()) {
        std::cout << "Found ts=" << it->first.seconds() << " val=" << *it->second << "\n";
    }

    // Read: range by timestamp
    std::cout << "ts==100:\n";
    for (auto p = s.lower_bound(Timestamp{100}); p != s.upper_bound(Timestamp{100}); ++p) {
        std::cout << "  " << p->first.seconds() << " -> " << *p->second << "\n";
    }

    // Update: extract -> modify -> insert
    if (it2 != s.end()) {
        auto nh = s.extract(it2);                        // 取出节点
        nh.value().first = Timestamp{105};               // 改键(时间戳)
        nh.value().second = std::make_unique<int>(555);  // 换指针(地址变)
        s.insert(std::move(nh));                         // 重新插入
    }

    // Delete: by heterogeneous key
    s.erase(std::pair<Timestamp, const int*>{Timestamp{100}, addr});

    // 遍历
    for (const auto& [ts, ptr] : s) {
        std::cout << ts.seconds() << " -> " << (ptr ? *ptr : -1) << "\n";
    }
}

相关推荐
云知谷7 小时前
【C++基本功】C++适合做什么,哪些领域适合哪些领域不适合?
c语言·开发语言·c++·人工智能·团队开发
仰泳的熊猫7 小时前
LeetCode:785. 判断二分图
数据结构·c++·算法·leetcode
^Moon^7 小时前
CycloneDDS:跨主机多进程通信全解析
c++·分布式·dds
l1t8 小时前
DeepSeek辅助利用搬移底层xml实现快速编辑xlsx文件的python程序
xml·开发语言·python·xlsx
C_Liu_9 小时前
C++:list
开发语言·c++
my rainy days9 小时前
C++:友元
开发语言·c++·算法
小梁努力敲代码9 小时前
java数据结构--List的介绍
java·开发语言·数据结构
云知谷10 小时前
【HTML】网络数据是如何渲染成HTML网页页面显示的
开发语言·网络·计算机网络·html
鄃鳕10 小时前
python 字典 列表 类比c++【python】
c++·python