【并行计算】多核处理器

这张图连接了几个并行计算的思想。

从上往下。

1.两个fetch/decode部件,是superscalar技术,每个cycle可以发射多个指令。

2.多个执行单元,支持乱序执行,是ILP,指令级并行。

3.每个执行单元里还支持SIMD操作。

4.有多个execution context,就相当于是有多套线程的状态,类似寄存器、堆栈。这样可以在一个核里跑多个线程。这样做的目的是为了更加充分的使用一个核里的ALU,指令级并行后还存在的stall,通过让另一个线程进入,让另一个线程的指令来填满空闲的ALU,是一种复用的思想。这是Simultaneous Multi-Threading技术。

5.缓存

说到存储,两个衡量的指标是Memory latency和Memory bandwidth。

Memory latency就是每次内存访问需要花费的延迟,包括了查缓存、内存访问、数据传输的时间。这个时间可以通过一些技术来减少,例如缓存、预取等技术。

Memory bandwidth就是处理器和存储设备之间传输的最大速率。

6.多核技术,这张图里展示了4个核。多核技术是2004年之后,大家发现不能再在一个芯片上放更多的二极管来提高主频速度了,因为单位面积的芯片放太多二极管的话高功率带来的热量会让芯片融化。所以大家开始探索多核技术。

相关推荐
Analog1117 小时前
电子秤采用 SIG5530 国产平替 CS5530
人工智能·嵌入式硬件·目标检测·硬件架构·信号处理·智能硬件
燃于AC之乐1 天前
【Linux系统编程】进程管理探秘:从硬件架构到僵尸/孤儿进程
linux·操作系统·硬件架构·进程管理·系统编程·冯诺依曼架构·僵尸、孤儿进程
开开心心就好2 天前
内存清理工具点击清理,自动间隔自启
linux·运维·服务器·安全·硬件架构·材料工程·1024程序员节
wotaifuzao3 天前
(九)一文吃透 BLE:从低功耗原理到协议栈与实战概念
物联网·硬件架构·蓝牙·低功耗·ble·设计原理
小时候逝去的夏夜3 天前
交叉编译入门:为什么要在 x86 上为 ARM 编译程序?
arm开发·硬件架构
Yuroo zhou5 天前
复杂煤层瓦斯抽采新路径:陀螺工具定向短节
硬件架构·石油·钻井·采矿·钻探·定向钻·钻孔
小郭团队6 天前
1_4_五段式SVPWM (传统算法反正切+DPWM0)算法理论与 MATLAB 实现详解
嵌入式硬件·算法·硬件架构·dsp开发
渡我白衣6 天前
计算机组成原理(15):定点数的移位运算
人工智能·神经网络·机器学习·硬件架构·硬件工程·计算机组成原理·移位运算
听情歌落俗8 天前
ARM架构-硬件架构和汇编指令
汇编·arm开发·硬件架构
小烤箱8 天前
CUDA 编程完全理解系列(第一篇):GPU 的设计哲学与硬件架构基础
自动驾驶·硬件架构·cuda·并行计算·感知算法