高带宽存储器与先进接口总线在RDL设计技术中的电气性能优化

人工智能、机器学习、汽车电子和5G等前沿应用均需高带宽、高性能、低功耗和低延迟,同时需保持或降低成本。由于设计、原型制作和工艺的高昂成本,采用单片系统级芯片(SoC)方案实现这些产品已不经济,且复杂SoC解决方案的设计周期较长。异构集成[1]成为更快速且低成本的替代方案。通过硅中介层、硅桥或有机基板上的高密度扇出技术,封装级异构集成可满足扩展需求并缩短设计周期。尽管异构集成优势显著,但因小芯片和I/O接口的多样性,其实际应用仍具挑战。标准化芯片间接口的努力将加速模块化系统的设计周期。

HBM2/3和AIB是当前最流行的接口。HBM用于连接CPU/GPU/ASIC与DRAM存储器,适用于高性能计算、图形和网络应用;AIB则用于逻辑芯片间的互连(如ASIC/FPGA与加速器芯片或光电收发器芯片)。

HBM2标准包含8个通道,每通道128位宽度,引脚数据速率为2Gbps。最新HBM标准支持3.2Gbps/引脚,总带宽可达409.6GB/s,需在约6mm的芯片边缘区域内路由约1700条线。

AIB标准支持24个通道,每通道包含80个发送(Tx)和80个接收(Rx)信号,数据速率2Gbps/信号,总带宽达3.84Tbps,需在8mm边缘区域内路由超过3900条线。

HBM和AIB可通过硅中介层、EMIB或高密度有机基板实现。下面将探讨基于聚合物HD-FOWLP RDL实现这些接口的电气设计挑战。

HD-FOWLP堆叠最多支持6层金属,结合精细线宽可实现高密度宽总线结构。例如,2um×2um线宽与2um间距的双层金属即可在6mm边缘内路由HBM接口。若采用1um×1um线宽与1um间距,密度可翻倍,但需考虑电气性能。这儿分析两种堆叠拓扑:

-拓扑一(图1):顶层和第三层用于信号布线,第二层和第四层为地平面,第五层为电源层。

-拓扑二(图2):前四层采用地-信号-信号(GSS)模式交替布线,第五层为电源层。

图1:第一种拓扑结构------5层HDFOLWP堆叠的三维视图和横截面视图;s为相邻信号线之间的距离;d为信号层与地之间的距离。

图2:第二种拓扑结构------5层HDFOLWP堆叠的三维视图和横截面视图;s为相邻信号线间距;d为信号与地间距;顶层四层采用GSS模式,第五层为电源。

减少金属层数可降低成本。以HBM为例,2um线宽与2um间距下,拓扑一需5层(2信号、2地、1电源);1um线宽与1um间距下,仅需3层(1信号、1地、1电源)。拓扑二在1um线宽下可进一步减少至2层。但需通过信号完整性分析选择最优方案。

信号线的频域分析

A.信号线的性能区域

细截面互连的直流电阻极高(如2um×2um铜线电阻约4.31Ω/mm,1um×1um线电阻增至四倍)。需通过衰减曲线和频率变化分析其特性。

图3显示了1um×1um线在拓扑一顶层的衰减曲线(左轴)和特性阻抗(右轴),介电层厚度d分别为0.5、1、2.5和4um。结果显示,薄介电层因邻近效应增强导致衰减更大,且RC(电阻-电容)与LC(电感-电容)区域的边界频率更高。仿真假设聚合物介电材料介电常数为3.2,损耗角正切为0.02。在1GHz(HBM2和AIB的奈奎斯特频率),特性阻抗范围从d=0.5um的120Ω到d=4um的190Ω。

图3:1um×1um导线在第一种拓扑结构顶层布线时的衰减曲线(左轴)和特性阻抗(右轴)随频率的变化;d=0.5、1、2.5和4um。

图4对比了1um和2um线在拓扑一中的衰减(α)和特性阻抗(|Z0|)。增大线宽可降低衰减和阻抗,因电阻减小且电容增加。顶层(微带线)的衰减较低但阻抗较高,第三层(带状线)则相反。

图4:1um×1um(实线)和2um×2um(虚线)导线在拓扑一中随频率的衰减(α)和特性阻抗(|Z0|)变化。

图5展示了拓扑二的类似分析。由于接地层分布均匀,不同层的性能差异较小。2um线在1GHz时特性阻抗为82Ω,但需频率超过6GHz才能稳定。

图5:1um×1um(实线)和2um×2um(虚线)导线在拓扑二中随频率的衰减和特性阻抗变化。

B.信号线的S参数响应

图6和图7分别展示了拓扑一和拓扑二中5mm长线的插入损耗与回波损耗。1um线因阻抗失配更严重,插入损耗和回波损耗均高于2um线。

图6:拓扑一中2um×2um和1um×1um导线的回波损耗与插入损耗。

图7:拓扑二中2um×2um和1um×1um导线的回波损耗与插入损耗。

四层RDL层的数据

基于拓扑一的四层测试载体通过高频测量验证。2um×2um截面线的仿真与实测数据(图8、图9)吻合良好,验证了模型的可靠性。

图8:3mm长2um×2um导线的插入损耗------仿真与实测对比。

图9:5mm长2um×2um导线的插入损耗------仿真与实测对比。

HD-FOWLP上的HBM与AIB总线实现

HD-FOWLP互连工作在RC区域或RC-LC过渡区,特性阻抗随频率大幅变化,难以实现宽带匹配。需结合瞬态时域仿真评估实际驱动器和负载下的性能。

A.HBM接口

拓扑二采用1um线宽时,仅需2层即可实现HBM接口,但5mm长线的眼图(图10)未满足HBM2的0.7UI宽度和480mV高度要求。

图10:拓扑二采用1um×1um导线的HBM接口眼图。

B.AIB接口

1um线宽需3层金属,10mm长线的眼图(图11)不符合AIB的0.4UI和180mV要求,但缩短至7mm可满足。

图11:拓扑一(左)和拓扑二(右)采用1um×1um导线的AIB接口眼图。

C.优化设计

增大线宽至2um可改善性能。拓扑一需5层金属,HBM眼图(图12)仍不达标,但AIB接口(图13)可满足时序要求。

图12:拓扑一(左)和拓扑二(右)采用2um×2um导线的HBM接口眼图。

图13:拓扑一采用2um×2um导线的AIB接口眼图。

调整线间距是降低串扰的有效方法。图14显示,2um线间距增至4um后,5mm长HBM总线的眼图(图15)符合规范,且仍可在2层金属内完成布线。

图14:2um×2um导线在拓扑一顶层的耦合变化:左(仿真)------固定线距s=2um,调整地间距d;右(实测)------固定d,调整s。

图15:2um×2um导线在s=2um(左)和s=4um(右)时的HBM接口眼图。

结论

上面分析了基于HD-FOWLP实现HBM和AIB接口的电气挑战。两种拓扑结构均适用,但需权衡层数、线宽和间距。通过时域仿真和实测验证,优化设计可满足规范要求。

历史文章精选

TSV结构中嵌入电容对HBM电源完整性设计的帮助

2025-04-23

HBM I/O接口中电源供应引起的抖动(PSIJ)分析与优化

2025-04-19

面向HPC平台应用的HBM电源完整性/信号完整性分析与设计方法

2025-04-11

HBM2E 信号完整性SI及timing budget的分析

2025-04-08

基于2.5D Si interposer设计的HBM3-SOC D2D SIPI设计

2025-04-05

HBM和Logic芯片间互连线的信号完整性评估方法

2025-04-02

HBM(高带宽内存)DRAM技术与架构

2025-03-31

在CoWoS平台上采用DTC电容器的Logic-HBM2E电源完整性设计

2025-03-30

高带宽存储器(HBM)的现状与未来挑战

2025-03-27

HBM2电源PDN设计及PSIJ仿真

2025-03-20

基于HBM芯片的PI-SI联合仿真

2024-06-26

AI加速芯片上的RDL inteposer高速信号设计

2025-12-18

相关推荐
卓码软件测评8 小时前
第三方软件课题验收测试【使用Docker容器部署LoadRunner负载生成器以实现弹性压测 】
测试工具·docker·容器·性能优化·单元测试·测试用例
Brduino脑机接口技术答疑9 小时前
脑机接口数据处理连载(十四) 实时数据处理:低延迟算法设计与性能优化
算法·性能优化·数据处理·脑机接口
阿华田51210 小时前
java程序性能优化篇
性能优化
码农很忙10 小时前
多线程的12种核心用途解析:从性能优化到系统革新
性能优化
老百姓懂点AI10 小时前
[性能优化] 击穿Python GIL瓶颈:智能体来了(西南总部)AI调度官的Rust重构实践与AI agent指挥官的高并发推理
人工智能·python·性能优化
Fgaoxing20 小时前
Go反射:性能瓶颈与零拷贝优化
性能优化·golang·反射
我真的是大笨蛋20 小时前
ACID底层实现:MySQL事务机制的深度解析
java·数据库·sql·mysql·性能优化
三水不滴21 小时前
从原理、场景深度分析Redis的分布式限流机制,根据不同场景设计合适的解决方案
数据库·经验分享·redis·笔记·分布式·缓存·性能优化
三水不滴1 天前
从原理到性能优化深度分析MySQL的order by处理
数据库·经验分享·笔记·mysql·性能优化