3.26[a]paracompute homework

444

3333

| | ​多线程 | ​多进程 |
| ​内存模型 | 共享同一进程的地址空间(全局变量、堆内存等) | 每个进程拥有独立地址空间,需通过IPC(管道、共享内存等)通信 |
| ​资源开销 | 线程创建/切换仅需分配栈空间 | 需复制父进程资源(内存、文件描述符等),上下文切换成本高 |
| ​同步与互斥 | 需锁机制(互斥锁、信号量等)避免数据竞争 | 进程间资源隔离,天然避免内存竞争(但需处理IPC同步) |

稳定性 线程崩溃可能导致整个进程终止 进程间隔离,单个进程崩溃不影响其他进程

多线程主要目的在于避免空闲的未使用资源,多进程的目的在于利用冗余的资源。

多线程可充分利用多核CPU并行执行;上下文切换仅涉及寄存器/栈,开销较小;线程之间能够更高效地实现资源共享,无需复杂的IPC机制。

方法 行为 资源管理 注意事项
join() 阻塞调用线程,等待目标线程执行完成 自动回收线程资源(栈、寄存器状态等) - 必须在析构前调用,否则触发std::terminate() - 同一线程只能join一次
detach() 分离线程生命周期,使其成为后台守护线程 资源由运行时(C++)或init进程(Linux)回收 - 分离后无法再join - 需确保线程不访问已销毁对象

一句话来讲,join方法产生的子线程是由调用线程管理的,而detach产生的子线程脱离了调用线程,由系统负责管理

22222

虚假共享是指多个线程访问同一缓存行中不同变量时,因为修改导致缓存一致性协议频繁触发,从而降低性能。具体来说,现代CPU的缓存以64字节的缓存行为单位管理,当一个线程修改缓存行中的数据时,其他线程的该缓存行会被标记为无效,需要重新从内存加载,即使这些线程操作的是缓存行中不同的变量

原因可归纳为一下两点:1.变量在内存中连续存储,可能被分配到同一缓存行,而MESI协议以缓存行为最小单位维护一致性,无法区分变量是否真正共享。2.​不同线程修改同一缓存行中的独立变量,触发缓存行无效化

1111

冯·诺依曼瓶颈指计算机中CPU与内存之间的数据传输速率远低于CPU计算速度,导致CPU因等待数据而空转的性能瓶颈。

在矩阵乘法运算中,利用缓存能够加快CPU获取矩阵数据,这主要基于空间局部性和时间局部性的原理;对于空间局部性,CPU按缓存行加载数据,一次加载可满足8次相邻地址浮点数之间的访问需求,此外,将B矩阵转置存储于缓存中,使 B[k][j] 按行访问,可避免跳跃式内存访问导致的缓存失效,从而可以进一步加快矩阵乘法计算速度;对于时间局部性,缓存可以避免重复从内存加载相同数据,如计算 C[i][j] 时需遍历 A 的第 i 行和 B 的第 j 列,若这些数据缓存在L1/L2中,后续计算 C[i][k] 或 C[k][j] 时可复用

其核心原因是冯·诺依曼架构中指令和数据共享同一总线,导致取指令和取数据无法并行

例如,当CPU需要频繁访问内存时,总线带宽不足会显著降低吞吐量,尤其在处理大规模数据时(如深度学习的矩阵运算)

在矩阵乘法W=U×V中,缓存通过以下机制缓解瓶颈:

  1. 时间局部性:频繁访问的行列元素(如U的行向量和V的列向量)被保留在高速缓存中,减少内存访问次数
相关推荐
摸鱼码17 分钟前
(头歌作业—python)3.2 个人所得税计算器(project)
开发语言·python
狐凄31 分钟前
练习题:110
开发语言·python·算法
YJlio44 分钟前
C盘清理技巧分享:PE & Dism++ 空间清理篇
c语言·开发语言
失乐园1 小时前
Redis性能之王:从数据结构到集群架构的深度解密
java·后端·面试
拖孩1 小时前
[特殊字符]我在 Chatterbox(话匣子)中 WebRTC 的使用-上篇(基本介绍)
开发语言·php·webrtc
鹿屿二向箔1 小时前
一些练习 C 语言的小游戏
c语言·开发语言
半个脑袋儿1 小时前
Java序列化:为何必须实现Serializable并显式指定serialVersionUID?
java
kfepiza1 小时前
Spring的 @Conditional @ConditionalOnProperty 注解 笔记250330
java·spring boot·spring
siy23331 小时前
[c语言日寄]柔性数组
c语言·开发语言·笔记·学习·算法·柔性数组
Allen Wurlitzer1 小时前
算法刷题记录——题解目录汇总(持续更新)
java·开发语言·算法