【并行计算】多核处理器

这张图连接了几个并行计算的思想。

从上往下。

1.两个fetch/decode部件,是superscalar技术,每个cycle可以发射多个指令。

2.多个执行单元,支持乱序执行,是ILP,指令级并行。

3.每个执行单元里还支持SIMD操作。

4.有多个execution context,就相当于是有多套线程的状态,类似寄存器、堆栈。这样可以在一个核里跑多个线程。这样做的目的是为了更加充分的使用一个核里的ALU,指令级并行后还存在的stall,通过让另一个线程进入,让另一个线程的指令来填满空闲的ALU,是一种复用的思想。这是Simultaneous Multi-Threading技术。

5.缓存

说到存储,两个衡量的指标是Memory latency和Memory bandwidth。

Memory latency就是每次内存访问需要花费的延迟,包括了查缓存、内存访问、数据传输的时间。这个时间可以通过一些技术来减少,例如缓存、预取等技术。

Memory bandwidth就是处理器和存储设备之间传输的最大速率。

6.多核技术,这张图里展示了4个核。多核技术是2004年之后,大家发现不能再在一个芯片上放更多的二极管来提高主频速度了,因为单位面积的芯片放太多二极管的话高功率带来的热量会让芯片融化。所以大家开始探索多核技术。

相关推荐
国信DRS杭州数据恢复1 天前
浪潮服务器RAID5磁盘阵列VMFS文件系统下虚拟机误删除数据恢复
运维·科技·硬件架构·硬件工程·运维开发
beleadsensors2 天前
模数转换ADC(上):模数转换(ADC)核心原理与关键概念
单片机·嵌入式硬件·硬件架构·硬件工程·pcb工艺
内有小猪卖3 天前
数字IC设计流程及术语
硬件架构·数字ic
newdf观察者3 天前
译码器转码操作及与IR、ALU的联动(模型机场景)
硬件架构
Aaron15884 天前
数字波束合成DBF与模拟波束合成ABF对比浅析
大数据·人工智能·算法·硬件架构·硬件工程·信息与通信·信号处理
智者知已应修善业5 天前
【CD4022八进制计数器脉冲分配器】2023-5-31
驱动开发·经验分享·笔记·硬件架构·硬件工程
Flamingˢ7 天前
ZYNQ + OV5640 视频系统开发(四):HDMI 显示链路
嵌入式硬件·fpga开发·硬件架构·音视频
学嵌入式的小杨同学8 天前
STM32 进阶封神之路(四十)FreeRTOS 队列、信号量、互斥锁精讲|任务通信、同步、资源保护(超详细图文版)
c++·stm32·单片机·嵌入式硬件·mcu·架构·硬件架构
UltraLAB-F9 天前
GPU显存不足时的分配策略:渲染与仿真的显存争夺战解决方案
图像处理·算法·3d·ai·硬件架构
学嵌入式的小杨同学14 天前
STM32 进阶封神之路(三十九)FreeRTOS 临界区、挂起 / 删除、钩子函数、调度底层原理|从应用到内核深度解析
c++·stm32·单片机·嵌入式硬件·mcu·硬件架构·pcb