异构融合计算技术白皮书(2023年)研读1

读到工业和信息化部电子第五研究所所做的《异构融合计算技术白皮书(2023年)》,我关注的重点是FPGA与异构计算。

1 灵活性:GPU>FPGA>DSA>ASIC

(1)GPU :CUDA编程模型(英伟达),(OpenCL编程模型 Xilinx intel)这点叫平台支持
(2)FPGA :基于FPGA的并行运算

(csdn一个文章《论述:FPGA中并行计算的常规方法 作者永恒的止水》:FPGA并行计算的基本常规方法为:流水线计算和交替计算。交替计算就是乒乓计算,基本思想是将计算单元复制若干份,交替地讲输入参数分配给各个计算单元,并且交替地将各个计算单元的计算结果输出,从而实现以N倍计算单元换取N倍计算速度)
(3)CGRA : 基于CGRA的并行运算 CRGA Corse-grained Reconfigurable Architecture 可重构计算

以空域为基础的并行计算结构 空域硬件结构组织 不同粒度和功能 云计算

(知乎上一个文章《并行计算与应用设计研究:Ultra-Elastic CGRAs for Irregular Loop Specialization论文研读》作者Jacob:总得来说CRGA更像是一个有着ALU阵列的单核处理器 ,兼具时间计算和空间计算的根本原因所在。可重构加速器结构,包括粗粒度可重构阵列,由于它们允许快速软件算法开发,并可在芯片流片后继续迭代 ,因此重新引起人们的兴趣)
(4)DSA :第一款是Google在2016年做出的TPU DSA领域专用处理器 基于DSA的并行计算,DSA可以在定制ASIC的基础上回调,加速计算密集型任务

(查的资料:搜索CUDA编程 GPU在所有需要高计算吞吐量的领域 最常见的接口CUDA,其次是OpenCL和HIP。在Python中使用CUDA的方法是通过Numba,CuPy或者英伟达的CUDA Python。CUDA有网格的概念,网格由块组成,块由线程组成。CUDA=compute unified device architecture 统一设备架构 做图像视觉领域会接触,做性能速度优化。图像在计算机里呈现的形式是矩阵。)

2 值得注意的专业术语

人工智能领域高并发密集的向量、张量计算
专业术语"领域"domain包含"场景"senario

FPGA 特事特定,具体问题具体分析

ASIC 单领域单场景

DSA 单领域多场景

GPU 多领域

DSA/ASIC 异构计算架构碎片化现象最凸显

DSA 灵活性有限,硬件、软件架构碎片化,性能和灵活性的细微平衡,支持动态添加处理器核心

(知乎的一个文章《软硬件共同定义:超异构开放生态》作者黄朝波:ASIC场景碎片化,毫无生态可言,原来碎片化指的是架构过多、市场碎片化、没有生态 。DSA架构分静态和动态,静态部分类似配置脚本,通过编译器映射到具体的DSA引擎,编程实现DSA引擎的具体功能;动态部分不是编程实现,是跟已有软件进行适配,相当于把软件的数据平面、计算平面卸载到硬件,控制平面仍然在软件。DSA是把某个领域多个场景的业务逻辑进行归纳,硬件实现共性部分,软件实现个性部分

相关推荐
黄埔数据分析5 小时前
QDMA把描述符当数据搬移, 不用desc engine
fpga开发
南檐巷上学11 小时前
基于FPGA的正弦信号发生器、滤波器的设计(DAC输出点数受限条件下的完整正弦波产生器)
fpga开发·数字信号处理·dsp·dds
嵌入式-老费16 小时前
Linux Camera驱动开发(fpga + csi rx/csi tx)
fpga开发
ALINX技术博客1 天前
【202601芯动态】全球 FPGA 异构热潮,ALINX 高性能异构新品预告
人工智能·fpga开发·gpu算力·fpga
JJRainbow1 天前
SN75176 芯片设计RS-232 转 RS-485 通信模块设计原理图
stm32·单片机·嵌入式硬件·fpga开发·硬件工程
s9123601011 天前
FPGA眼图
fpga开发
北京青翼科技2 天前
【PCIe732】青翼PCIe采集卡-优质光纤卡- PCIe接口-万兆光纤卡
图像处理·人工智能·fpga开发·智能硬件·嵌入式实时数据库
minglie12 天前
verilog信号命名规范
fpga开发
XINVRY-FPGA2 天前
中阶FPGA效能红线重新划定! AMD第2代Kintex UltraScale+登场,记忆体频宽跃升5倍
嵌入式硬件·fpga开发·硬件工程·dsp开发·fpga
南檐巷上学2 天前
基于FPGA的音频信号监测识别系统
fpga开发·音频·verilog·fpga·傅立叶分析·fft·快速傅里叶变换