一 概述
C++ 程序确实有可能读取到部分写入的数据,但这通常发生在多线程或多进程环境中,且没有使用同步机制时。
二 具体
1 对于基础类型(如 int、char):
如果在一个线程中写入一个简单的、对齐的变量(如 int x = 0;),而在另一个线程中同时读取,在大多数现代CPU上,单次对齐的读写是"原子"的。这意味着读操作要么看到旧值,要么看到新值,不会读到"一半新一半旧"的乱码。
但是,这里的关键是"可见性"。如果不使用同步,编译器或CPU可能会重排指令。写线程的赋值可能停留在CPU缓存中,尚未写回内存,导致读线程读到旧的、过时的值。虽然这不是"字节错乱",但本质上也是读到不一致的数据。
2 对于复合类型或非对齐数据(如 struct、数组、long long):
绝对会发生"撕裂写"(torn write)。例如,一个 64 位整数在某些 32 位平台上需要两条指令写入。如果读线程恰好在第一条写入后、第二条写入前读取,就会得到一个由"高32位新数据 + 低32位旧数据"拼凑而成的、从未存在过的错误值。
一个结构体或类的多个成员变量更是如此,读线程可能看到一部分成员更新了,另一部分没更新。
三 如何避免?
1 使用原子操作(std::atomic): 它将保证操作的"原子性"和"可见性"。例如 std::atomic<int>,即使跨线程,也能确保你读到的是完整的、最新的值。
2 使用互斥锁(std::mutex): 在读写两端都加锁,锁能保证操作在临界区内不会被中断,且释放锁时会同步内存。
3 使用内存屏障(std::atomic_thread_fence): 控制读写指令的顺序,但实现复杂,通常优先使用前两者。
四 内存映射文件(mmap)
如果你用内存映射并跨进程共享,且写入端正在写入,另一个C++进程读取同一个映射区域完全可能读到部分写好的数据(例如写一个 struct 写到一半时进程被抢占)。这里没有语言运行时保护,必须自己用进程间同步原语(如互斥锁、信号量)来控制。
五 总结
单线程:不会(除非你用异步信号处理函数)。
多线程:可能读到部分数据("撕裂")或过时数据,必须用原子/互斥锁保护。
多进程共享内存:完全可能,必须自己加锁。
简单原则:只要有数据跨线程或进程共享,并且至少有一方在修改,就必须使用同步机制,不能依赖直觉或CPU的"对齐"特性。