C++ 中的 volatile 和 atomic

C++ 中的 volatile 和 atomic

0. TL;DR

  • std::atomic 用于多线程并发场景,有两个典型使用场景:

    • 原子操作:对 atomic 变量的操作(读/写/自增/自减)仿佛受互斥量保护。一般通过特殊的机器指令实现,比使用互斥量更高效
    • 限制编译器/硬件对赋值操作的重新排序
  • volatile 和多线程并发没有任何关系,用于防止编译器优化掉对特殊变量的"冗余"读写操作

1. Data Race 和未定义行为

C++ 中有很多未定义行为,Data Race 便是其中之一。

⚠️ 如果一个变量不是 atomic 变量,且没有互斥量保护,在一个线程中执行写操作,同时在另一个线程中读取,则会产生 Data Race,其行为未定义!

例如在执行下面代码的过程中,另一个线程同时读取 i 的值,读到的值可能是 -13,42,0,43923... 任何值!

int i = 0;
++i;
--i;

虽然在这种场景下,你读到的大概率是0/1,但要知道,对于未定义行为,理论上可能读到任何值!!

2. atomic

std::atomic 是 C++ 中的模版类,一般用于 bool、整型、指针类型,如 atomic<bool>atomic<int>atomic<Widget*> 等。对 atomic 变量的操作(读/写/自增/自减)仿佛受互斥量保护(底层一般通过特殊的机器指令实现,比使用互斥量更高效)。

2.1 原子操作

atomic 的第一个应用场景就是多线程读写变量

cpp 复制代码
atomic<int> ai {0};
ai = 10;         // 原子写
std::cout << ai; // 原子读
++ai;            // 原子自增为11
--ai;            // 原子自减为10

执行上述代码期间,如果在另一个线程读取 ai 的值,只可能读到 0/10/11,不可能有其他结果

2.2 限制重排序

atomic 的第二个应用场景是,当某个变量在两个任务之间传递信息时,防止对该变量赋值进行重新排序。假设 a、b、x、y 是 4 个独立的变量:

cpp 复制代码
a = b;
x = y;

为了提升性能,编译器可能会对不相关的赋值进行重新排序为:

cpp 复制代码
x = y;
a = b;

即使编译器不这么做,底层硬件也可能这么做。atomic 可以避免这种重排序。例如在一个任务中计算 value,另一个任务中依赖 value 的可用性,则可以借助 atomic 变量实现:

cpp 复制代码
atomic<bool> valueAvailable(false);
auto value = computeValue();
valueAvailable = true;

std::atomic 默认采用顺序一致性模型,会限制重新排序:不仅编译器会保证 value 在 valueAvailable 之前赋值,底层硬件也保证这个顺序。

⚠️ C++ 还提供了其他更灵活的一致性模型(如 memory_order_relaxed),除非你是这方面的专家,很清楚不同内存序产生的影响,否则不要轻易使用。

2.3 load/store

有的开发者喜欢使用 load()/store() 成员函数,这不是必须,但可以起到强调作用:

  • 强调该变量涉及多线程并发操作
  • 强调 atomic 变量可能导致性能问题
    • 虽然 atomic 比互斥量更高效,但仍然比普通变量慢、开销大
    • atomic 变量可能会阻止重新排序优化

3. volatile

如果将上面的例子中的 atomic<bool> 换成 volatile bool,既无法保证操作的原子性,也无法限制对 value 和 valueAvailable 赋值的重新排序。

cpp 复制代码
volatile bool valueAvailable(false);
auto value = computeValue();
valueAvailable = true;

对于普通内存来说,如果向某个内存写一个值,该值会一直保留在内存,直到被下一个写操作覆盖。编译器可以对普通内存的变量读写进行优化,例如下面这段代码(虽然一般开发者不会直接写出这样的代码,但是经过模版实例化、内联、重排序等优化后,很可能产生类似的代码):

cpp 复制代码
int x;
auto y = x; // 读取 x
y = x;  // 再次读取 x
x = 10; // 写入 x
x = 20; // 再次写入 x

可能被优化为:

auto y = x;
x = 20;

但是在有些特殊场景下(例如和外设交互),变量对应特殊的内存区域:

  • x 可能是一个传感器的值,连续两次读取 x 的值可能不同,不应该被优化

  • x 可能对应某个无线电发射器的控制端口,x = 10x = 20 对应两条不同的指令,不应该被优化

volatile 的作用正是告诉编译器,某个变量所对应内存是特殊内存,不要进行任何优化!

将 x 声明为 volatile int x 即可避免上述优化,而声明为 atomic<int> x 则没有这个效果。

⚠️ 经常听到一种说法:开启编译器优化选项之后,会导致程序行为异常。但通常都不是编译器的问题,而是自己的代码不规范,或依赖了未定义行为导致的!

思考:

  • volatile 和 atomic 可以同时使用吗,用于什么场景?
  • volatile 和 const 可以同时使用吗,用于什么场景?

4. Reference

《Effective Morden C++》条款 40

相关推荐
无尽的大道4 分钟前
Java字符串深度解析:String的实现、常量池与性能优化
java·开发语言·性能优化
superman超哥26 分钟前
04 深入 Oracle 并发世界:MVCC、锁、闩锁、事务隔离与并发性能优化的探索
数据库·oracle·性能优化·dba
前端青山10 小时前
Node.js-增强 API 安全性和性能优化
开发语言·前端·javascript·性能优化·前端框架·node.js
青云交15 小时前
大数据新视界 -- 大数据大厂之 Impala 性能优化:应对海量复杂数据的挑战(上)(7/30)
大数据·性能优化·impala·数据分区·查询优化·海量复杂数据·经典案例
chusheng184019 小时前
Python 爬取大量数据如何并发抓取与性能优化
开发语言·python·性能优化
XMYX-02 天前
MySQL 性能优化策略:提升响应速度与系统稳定性
mysql·性能优化
PangPiLoLo2 天前
高可用架构-业务高可用
java·性能优化·架构
尸僵打怪兽2 天前
软考(中级-软件设计师)数据库篇(1101)
数据库·oracle·性能优化·软考
程序猿进阶2 天前
系统上云-流量分析和链路分析
java·后端·阿里云·面试·性能优化·系统架构·云计算
island13143 天前
【Java多线程】:理解线程创建、特性及后台进程
java·开发语言·多线程