1. RFSoC的整体架构概览
AMD Zynq UltraScale+ RFSoC是目前业界集成度最高的软件定义无线电平台之一。它将处理系统(PS) 、可编程逻辑(PL) 、射频数据转换器(RF-ADC/DAC) 以及软判决前向纠错(SD-FEC) 等模块集成于单芯片。
这种架构打破了传统"FPGA + 外部ADC + 外部处理器"的多芯片方案,极大简化了硬件设计,同时降低了功耗和延迟。
2. 处理系统(PS)------软件与控制的中心
PS是一个完整的嵌入式处理子系统,基于ARM架构,主要负责:
-
运行操作系统(Linux、RTOS)与上层应用
-
控制RF-ADC/DAC、DDC/DUC等硬核模块的参数
-
实现通信协议栈(MAC层及以上)
-
管理数据流和外部接口(以太网、PCIe、USB等)
2.1 应用处理单元(APU)
APU包含四核ARM Cortex-A53处理器,主频可达1.3GHz以上。每个核心拥有独立的L1缓存(32KB指令+32KB数据),共享1MB L2缓存。Cortex-A53支持64位指令集,适合运行Linux等操作系统,处理网络协议、用户界面、系统调度等复杂任务。
2.2 实时处理单元(RPU)
RPU包含双核ARM Cortex-R5处理器,主频可达600MHz。Cortex-R5面向实时应用,具有低延迟中断响应和紧耦合内存(TCM),适合执行时间敏感的控制任务,如RFDC的实时配置、同步校准、功率监测等。
2.3 平台管理单元(PMU)与安全
PMU基于三冗余MicroBlaze核,负责上电时序、时钟管理、电源域控制及系统监控。配置安全单元(CSU)支持安全启动、AES加密、SHA验证等,保护比特流和敏感数据。
2.4 PS与PL的数据交互------AXI接口与一致性
PS与PL之间通过AXI4总线进行高速数据交换。主要包括三种接口类型:
-
AXI4:内存映射,支持突发传输,适用于大块数据搬移(如DMA)
-
AXI4-Lite:内存映射,单次传输,适用于控制寄存器读写
-
AXI4-Stream:流式传输,无地址,适用于连续数据流(如IQ样本)
在多通道数字阵列系统中,PL产生的海量IQ数据通常通过AXI-DMA 经一致性互联(CCI)写入PS的DDR内存,保证数据在多个处理器核心间的可见性。PS中的ARM核也可以直接访问PL中的寄存器,实现实时参数调整。
3. 可编程逻辑(PL)------硬件加速的核心
PL本质上是一块大容量FPGA,由可配置逻辑块(CLB)、DSP切片、块RAM(BRAM)、UltraRAM以及高速收发器(GTY)等资源构成。其主要任务包括:
-
实现数字下变频(DDC)和数字上变频(DUC)
-
执行高速滤波、FFT、波束形成等实时信号处理
-
连接RF-ADC/DAC,处理高数据率IQ流
-
实现自定义通信或雷达算法
3.1 可配置逻辑块(CLB)
每个CLB包含多个查找表(LUT)和触发器(FF)。LUT可实现6输入逻辑函数或作为分布式RAM/移位寄存器使用。FF用于寄存数据或构成计数器、状态机。这些基本单元是构建任何数字电路的基础。
3.2 DSP48E2切片------乘累加加速器
DSP48E2是专为数字信号处理优化的硬核单元。每个切片支持:
-
27×18位有符号乘法
-
预加器(可实现对称滤波器)
-
累加器/加法器/减法器
-
可级联多个切片构成更长位宽
在波束形成应用中,每个天线通道的加权求和可以映射为一个DSP切片乘以复数权重后累加,充分利用硬核资源实现高吞吐量。单个RFSoC器件(如ZU49DR)包含4,272个DSP切片,足以支持128通道、高带宽的实时处理。
3.3 存储器资源:BRAM与UltraRAM
-
块RAM(BRAM) :每个36Kb,可配置为双端口RAM或FIFO,常用于数据缓冲、滤波器系数存储、FFT旋转因子存储。总容量通常为38Mb。
-
UltraRAM :更大的存储块(288Kb),适合大容量数据缓存,总容量可达22.5Mb以上。
在多通道系统中,BRAM常被分配给各通道的FIFO或延迟线,UltraRAM则用于存储大块波形数据或FFT中间结果。
3.4 高速收发器(GTY)
GTY收发器支持12.5Gbps~32.75Gbps的串行链路,用于板间互联(如100G以太网)、JESD204B接口或PCIe。在多板级联的数字阵列中,GTY可用于传输同步时钟和高速IQ数据。
4. PS与PL的协同设计------异构计算范例
以雷达信号处理为例,典型的任务划分如下:
-
PL:实时处理连续IQ流------数字下变频、脉冲压缩(匹配滤波)、MTI/MTD(FFT)、CFAR检测。这些操作对延迟敏感且数据率高,适合硬件流水线。
-
PS:执行非实时任务------目标跟踪滤波(卡尔曼滤波)、点迹关联、显控界面、网络通信。这些操作涉及复杂分支和浮点运算,适合ARM核处理。
PS与PL之间的数据交换通过AXI-DMA完成,DMA控制器在PL端将处理完的雷达回波数据写入PS的DDR,并触发中断通知ARM核读取。
这种异构架构兼具了FPGA的高吞吐并行性和ARM的灵活控制能力,是实现高性能SDR的关键。
5. RFSoC在多通道数字阵列中的资源分配
以128通道全数字阵列为例,系统需要:
-
16片RFSoC (每片8通道)或8片(每片16通道)
-
每片RFSoC的PL需实现:8路DDC、抽取滤波、8点FFT(或部分波束形成)
-
板间同步需要共享SYSREF时钟,并通过GTY交换数据
资源估算:每个通道的DDC需要约20~50个DSP切片(取决于滤波器阶数),128通道总计约3000~5000个DSP切片。ZU49DR单芯片可提供4272个DSP切片,因此一片即可支持64~128通道的前端预处理,体现了RFSoC的高集成度优势。
6. 小结
RFSoC的PS与PL协同工作,为软件定义无线电提供了理想的异构计算平台。PS负责系统控制与协议栈,PL负责实时信号处理,两者通过AXI总线高效交互。理解这一架构是设计高性能数字阵列系统的基础。


下一篇预告:我们将深入RF-ADC,讲解采样率、分辨率、SFDR、多通道同步等核心参数及其工程考量。