C++ 中的 volatile 和 atomic

C++ 中的 volatile 和 atomic

0. TL;DR

  • std::atomic 用于多线程并发场景,有两个典型使用场景:

    • 原子操作:对 atomic 变量的操作(读/写/自增/自减)仿佛受互斥量保护。一般通过特殊的机器指令实现,比使用互斥量更高效
    • 限制编译器/硬件对赋值操作的重新排序
  • volatile 和多线程并发没有任何关系,用于防止编译器优化掉对特殊变量的"冗余"读写操作

1. Data Race 和未定义行为

C++ 中有很多未定义行为,Data Race 便是其中之一。

⚠️ 如果一个变量不是 atomic 变量,且没有互斥量保护,在一个线程中执行写操作,同时在另一个线程中读取,则会产生 Data Race,其行为未定义!

例如在执行下面代码的过程中,另一个线程同时读取 i 的值,读到的值可能是 -13,42,0,43923... 任何值!

int i = 0;
++i;
--i;

虽然在这种场景下,你读到的大概率是0/1,但要知道,对于未定义行为,理论上可能读到任何值!!

2. atomic

std::atomic 是 C++ 中的模版类,一般用于 bool、整型、指针类型,如 atomic<bool>atomic<int>atomic<Widget*> 等。对 atomic 变量的操作(读/写/自增/自减)仿佛受互斥量保护(底层一般通过特殊的机器指令实现,比使用互斥量更高效)。

2.1 原子操作

atomic 的第一个应用场景就是多线程读写变量

cpp 复制代码
atomic<int> ai {0};
ai = 10;         // 原子写
std::cout << ai; // 原子读
++ai;            // 原子自增为11
--ai;            // 原子自减为10

执行上述代码期间,如果在另一个线程读取 ai 的值,只可能读到 0/10/11,不可能有其他结果

2.2 限制重排序

atomic 的第二个应用场景是,当某个变量在两个任务之间传递信息时,防止对该变量赋值进行重新排序。假设 a、b、x、y 是 4 个独立的变量:

cpp 复制代码
a = b;
x = y;

为了提升性能,编译器可能会对不相关的赋值进行重新排序为:

cpp 复制代码
x = y;
a = b;

即使编译器不这么做,底层硬件也可能这么做。atomic 可以避免这种重排序。例如在一个任务中计算 value,另一个任务中依赖 value 的可用性,则可以借助 atomic 变量实现:

cpp 复制代码
atomic<bool> valueAvailable(false);
auto value = computeValue();
valueAvailable = true;

std::atomic 默认采用顺序一致性模型,会限制重新排序:不仅编译器会保证 value 在 valueAvailable 之前赋值,底层硬件也保证这个顺序。

⚠️ C++ 还提供了其他更灵活的一致性模型(如 memory_order_relaxed),除非你是这方面的专家,很清楚不同内存序产生的影响,否则不要轻易使用。

2.3 load/store

有的开发者喜欢使用 load()/store() 成员函数,这不是必须,但可以起到强调作用:

  • 强调该变量涉及多线程并发操作
  • 强调 atomic 变量可能导致性能问题
    • 虽然 atomic 比互斥量更高效,但仍然比普通变量慢、开销大
    • atomic 变量可能会阻止重新排序优化

3. volatile

如果将上面的例子中的 atomic<bool> 换成 volatile bool,既无法保证操作的原子性,也无法限制对 value 和 valueAvailable 赋值的重新排序。

cpp 复制代码
volatile bool valueAvailable(false);
auto value = computeValue();
valueAvailable = true;

对于普通内存来说,如果向某个内存写一个值,该值会一直保留在内存,直到被下一个写操作覆盖。编译器可以对普通内存的变量读写进行优化,例如下面这段代码(虽然一般开发者不会直接写出这样的代码,但是经过模版实例化、内联、重排序等优化后,很可能产生类似的代码):

cpp 复制代码
int x;
auto y = x; // 读取 x
y = x;  // 再次读取 x
x = 10; // 写入 x
x = 20; // 再次写入 x

可能被优化为:

auto y = x;
x = 20;

但是在有些特殊场景下(例如和外设交互),变量对应特殊的内存区域:

  • x 可能是一个传感器的值,连续两次读取 x 的值可能不同,不应该被优化

  • x 可能对应某个无线电发射器的控制端口,x = 10x = 20 对应两条不同的指令,不应该被优化

volatile 的作用正是告诉编译器,某个变量所对应内存是特殊内存,不要进行任何优化!

将 x 声明为 volatile int x 即可避免上述优化,而声明为 atomic<int> x 则没有这个效果。

⚠️ 经常听到一种说法:开启编译器优化选项之后,会导致程序行为异常。但通常都不是编译器的问题,而是自己的代码不规范,或依赖了未定义行为导致的!

思考:

  • volatile 和 atomic 可以同时使用吗,用于什么场景?
  • volatile 和 const 可以同时使用吗,用于什么场景?

4. Reference

《Effective Morden C++》条款 40

相关推荐
程序猿进阶30 分钟前
堆外内存泄露排查经历
java·jvm·后端·面试·性能优化·oom·内存泄露
工业甲酰苯胺8 小时前
Redis性能优化的18招
数据库·redis·性能优化
无尽的大道14 小时前
深入理解 Java 阻塞队列:使用场景、原理与性能优化
java·开发语言·性能优化
loey_ln14 小时前
webpack配置和打包性能优化
前端·webpack·性能优化
&梧桐树夏1 天前
JavaEE 线程安全
java-ee·多线程
郭梧悠1 天前
HarmonyOS(57) UI性能优化
ui·性能优化·harmonyos
奈斯ing1 天前
【Oracle篇】SQL性能优化实战案例(从15秒优化到0.08秒)(第七篇,总共七篇)
运维·数据库·sql·oracle·性能优化
程序猿小D1 天前
第三百三十节 Java网络教程 - Java网络UDP服务器
java·开发语言·网络·网络协议·udp·多线程
控心つcrazy2 天前
图片渐进式加载优化实践指南
优化·加载·图片优化·渐进式