硅光子学和集成光学

介绍

这本入门书解释了光通信的基本概念、硅光子学的发展、行业如何朝着将光学器件与 ASIC 集成到联合封装解决方案中的方向发展,以及未来......

光通信

二十年前部署网络交换机/路由器时,主要使用铜缆进行数据传输。但铜电缆受电子速度的限制,大多适用于较低的速率。随着数据速率的增加,这些电缆的覆盖范围会减小,100Gbps 以太网链路的覆盖范围不到 3m。铜缆主要适用于连接机架内的端口(如主机服务器和 TOR 交换机之间的连接)。

当今的网络设备(高性能交换机、路由器和智能网卡)支持大于 400Gbps 的链路,这些设备的带宽几乎每 2-3 年翻一番。光纤电缆已大多取代了铜缆,用于通过这些高速链路传输数据。这些电缆使用光而不是电流来传输信息。它们由细小的玻璃丝制成,每根玻璃丝的大小与人类的头发差不多。它们以光脉冲(红外光束)的形式以达到光速的速度传输数据。光纤电缆具有出色的覆盖范围(远程光学器件支持高达 80km-120km 的范围)。它们更可靠,因为它们使用全内反射来传输光脉冲,并且不受电磁推断的影响。纤维也更能抵抗温度变化,可以承受更大的压力等。正因为如此,光缆是高速网络链路的不二之选。

可插拔光收发器(可插拔模块)

光缆依靠两端的光收发器将电信号转换为光脉冲,以便通过光缆传输,并将光脉冲转换回接收侧的电信号。这些收发器是光纤链路性能的关键驱动因素。这些通常是插入网络设备前面板的可插拔模块。收发器依靠光学元件来操纵光,通过光纤链路传输数据。收发器中的典型组件如下:

传输(电气到光纤)

输入缓冲器(或重定时器)通过电气互连接收来自网络芯片的数据。数据通过数模转换器(DAC)转换为电压。驱动器放大电压并将其发送到相干调制器。激光器通常位于透射光学组件或 TOSA 内部并发射红外光束。调制器根据其调制的输入电压调制激光器发出的光。这种模块化的光被光放大器放大(并与其他通道多路复用),并通过耦合接口发送到光纤阵列。

接收(光到电):

它通常包含解复用器、利用光电效应将光束转换为电信号的光电二极管,以及将光电二极管电流转换为电压的放大器。之后,模数转换器(ADC)将模拟电压转换为数字数据,数据通过输出缓冲器(重定时器)发送到电气接口。

这是对收发器的非常高级和过于简化的描述。该系统可以包含更多的放大器和额外的降噪电气/模拟元件。传统收发器中的许多模拟和数字元件都作为分立元件排列在PCB上,激光器和光电二极管位于其外壳的外部。

可插拔光学器件的优缺点

在通过以太网接口接收数据的典型网络设备中,您将看到一个带有用于可插拔光收发器的笼子或插槽的前面板。系统内部的网络芯片通过电路板上的电气互连(PCB走线)连接到可插拔光学器件。通常,芯片内的高速服务器将数据驱动到这些互连器。这些互连器在电气域中传输数据,并且通常在PCB上具有中继器模块,以在信号到达光收发器之前提高信号强度。

通过可插拔接口将光收发器与网络芯片解耦具有许多优点。它使构建交换机无需担心将连接到每个端口的光学器件类型(速度、范围)。网络运营商可以根据需要灵活地将不同的电缆连接到交换机的不同端口。

多源协议 (MSA) 的出现使这些可插拔光收发器的可互操作实现成为可能,并创建了一个生态系统,每种类型的模块都有许多供应商。因此,避免了单一来源的依赖并降低了成本。可插拔光学器件还支持增量部署("随增长付费"),其中一部分端口最初保持未填充状态,并根据需要购买和安装额外的光学器件。此外,由于模块可以从前面板访问,因此可以相对容易地进行现场维修和升级。

然而,随着这些光学接口速度的提高,前面板可插拔光学器件的功耗/成本与它们传输数据的ASIC相比并没有增加。收发器中的无数组件占用了大量空间。对于超过 800Gbps 的速度,我们可能需要更大外形尺寸的可插拔光学器件 (OSFP),这将占用前面板的更多区域。

将Serdes连接到字体面板光学模块的电气互连通常是高损耗的,并且需要在光学器件内部/板上使用耗电的重定时器,并在ASIC中使用高功率Serdes(Long Range Serdes),所有这些都会消耗额外的功率。

在过去的二十年中,高端网络芯片的带宽大约每2-3年翻一番。这样一来,serdes的速度已经从10Gbps(二十年前)上升到当前一代的112Gbps(以支持800GE以太网链路)。200Gbps serdes 即将到来。不幸的是,以模拟电路为主的serdes在功率或芯片面积上的缩放都没有晶体管缩放那么多。在更高的速度下,这些 serde 需要具有 PAM4 信号,这也消耗大量功率。因此,随着交换机吞吐量的增加,Serdes消耗的总交换机功率的百分比会继续增加。

以大于 50Gbps 的速率通过 serdes 传输信号需要前向纠错 (FEC) 编码,这会增加 ~100ns 的额外延迟。虽然网络应用程序可以容忍这些延迟,但它会对在依赖于计算引擎之间的电气连接的 HPC 集群上运行的分布式计算应用程序的性能产生负面影响。与电域相比,光域中的数据移动在功耗和延迟方面都非常高效。

此外,传统的光收发器价格昂贵。它们的发射器和接收器子组件必须经过精心构造和密封以保护。制造过程缓慢,难以跟上不断增长的需求。

网络以及 HPC 系统可以从低功耗/低成本光收发器和新设计中受益匪浅,这些设计可减少 PCB 电气域中的数据移动。

光子集成电路(PIC)的演进

在光子集成平台中,许多用于构建收发器的光学和电气元件被封装在称为光子集成电路 (PIC) 的高度集成芯片中。将所有组件集成在单个基板上可以降低收发器的构建成本,并且由于分立光学组件之间的耦合效应较小,因此可以降低功耗。

目前,InP(磷化铟)和Si(硅/CMOS基)是构建PIC的两大主流集成平台。

InP 使用基于 InP 的合金实现所有光学功能,包括发光(激光)、透射、调制和检测。硅光子学使用绝缘体上硅(SOI)晶圆作为半导体衬底材料,大多数标准CMOS制造工艺都可用于构建PIC。

在InP光子学平台中,由于成熟的技术(该平台进行了数十年的光子元件开发)和III-V族材料的优越光子特性,激光器、光放大器和调制器的性能远优于硅光子学(SiPh)平台中的相应组件。

尽管完全集成的基于 InP 的 PIC 具有性能优势,但大多数光学设备和组件供应商都在硅光子学方面投入巨资。正因为如此,SiPh PIC在性能/成本方面正在赶上InP。

选择硅光子学的主要原因是,建立磷化铟制造设施需要专业知识和大量的前期投资,该工厂可以提供商业数量的基于InP的高性能PIC。对于没有基于InP的平台经验且没有磷化铟晶圆厂的供应商来说,利用CMOS代工厂生态系统的能力提供了更快、更低投资将光子集成电路推向市场的选择。此外,现有的 IC 制造工艺提供了尖端光刻技术、先进的自动化以及更好地筛选缺陷部件。与InP晶圆(~100mm)相比,CMOS晶圆较大(300mm),这也有助于大批量生产。

典型光子芯片的基本结构是将各种组件连接在一起的低损耗波导。在SiPh PIC中,这些波导由硅芯和二氧化硅/氮化硅(或这些材料的各种组合)包层制成,以形成一种高折射率介质,用于在芯片上和各种组件之间传输电光信号。SiPh波导提供了一个卓越的低损耗平台(远优于InP波导),并实现了带宽扩展的组件的大规模集成。

虽然硅光子学平台能够设计出比相应InP组件更小尺寸的大多数光学元件,但由于硅的物理特性,它无法提供集成的激光器和光放大器。因此,许多使用 SiPh PIC 构建的收发器都具有单独的基于 InP 的激光器和掺铒光纤放大器 (EDFA)。这些通常与 PIC 共同打包。基于 InP 的激光器还可以通过自对准倒装芯片凸块连接到硅光子芯片上,这些凸块提供薄型和紧密耦合的芯片到激光器互连。

虽然外部放大器和激光器确实提供了卓越的性能,但SiPh PIC与PIC外部的激光器/放大器之间的耦合光学器件可能具有更高的耦合损耗。

人们可能会争论是否需要集成激光器。将激光器集成到 PIC 内部需要对整个 PIC 进行非常严格的热控制,否则激光器可能会失效。尽管如此,最近通过将III-V族(InP)材料结合在硅衬底上,已经实现了高质量的混合激光器和光放大器。这种异构集成利用了硅基加工,同时利用 III-V 族材料进行光发射和放大。但这个过程复杂、昂贵,而且只有少数先进的光子代工厂才能商用。

在亚微米级将光纤连接到PIC也是一个复杂的过程,需要特殊的机器和生产流程中的其他自定义步骤来验证连接(主动对准)。目前正在研究如何使光纤连接器能够直接连接到PIC内部的波导。

因此,随着对研发的大量投资,研究人员正在寻找新的方法来绕过或克服硅光子学集成中仍然存在的少数挑战。

可插拔 SiPh 收发器

借助硅光子学,光收发器内部的分立元件可以被单片 PIC 取代,从而在不改变收发器外形尺寸的情况下获得功耗、面积和成本优势。这使得基于硅光子学的可插拔收发器能够无缝集成到现有系统中。即使激光器和光放大器不能与其他组件集成在一起,将剩余的光子、模拟和数字组件集成到单个芯片中也具有成本和功耗优势。

数据中心内对低功耗收发器的需求很高,随着新的 AI/ML 工作负载、微服务和服务器分解,流量呈指数级增长。许多光学供应商正在积极投资 SiPh 收发器。漫威在收购 InPhi 方面处于领先地位。Marvel 最近发布了一款 400Gbps QSFP28 外形尺寸的 SiPh 可插拔模块,范围为 80-120 公里(ZR 光学器件)。英特尔和思科是其他一些为数据中心范围(DR 光学器件)提供 100Gbps/400Gbps 产品的供应商。

到 2025 年,硅光子学市场预计将增长到 3-40 亿美元,复合年增长率为 23.4%,数据中心和 HPC 应用预计将以其对低功耗光收发器的需求引领市场。

共封装光学器件 (CPO) 案例

在典型的单机架单元 (1RU) 开关盒中,可以安装 32-36 个可插拔光笼,如下图所示。由于它们的尺寸很大,这些笼子占据了前面板的大部分,并且进入系统的气流量受到阻碍。800G以上的可插拔模块可能需要更大的外形尺寸来应对散热方面的问题。这将进一步影响前面板密度。

系统电源的另一个主要组成部分是由数据通过效率低下的电气介质(电路板上的铜走线)从ASIC移动到光模块引起的。

板载光学器件 (OBO) 和共封装光学器件 (CPO) 是减少 ASIC 和光收发器之间电气互连的两种方法,前者可以将光模块放置在更靠近 ASIC 的 PCB 上,后者可以将光模块和 ASIC 封装在一起。一旦光学器件进入系统,前面板密度以及进入系统的气流也将得到改善。

对于板载光学器件,尽管将光学器件从前面板移动到 PCB,但开关和光模块之间的电通道损耗并不足以显着降低功耗。但是,这确实改善了热环境,因为所有光学模块的热量都没有集中在前面板上。由于投资回报率较低,车载光学器件没有获得动力。

将光学器件与ASIC共同封装,完全消除了ASIC外部电气域中的数据移动。有几种方法可以将网络芯片与光学器件共同封装。

在基本方法中,网络芯片包含与网络功能相关的所有逻辑(交换/路由、以太网接口、serdes),而PIC包含光收发器逻辑。由于网络芯片和PIC在同一封装基板上彼此非常接近,因此通道插入损耗非常小。因此,可以简化serdes设计以获得面积/功率优势。XSR serdes(超短距离 serdes,~50mm 伸展)或 VSR(极短距离 serdes,~200mm 伸展)是一些供应商专门为此目的设计的。

XSR/VSR serdes和封装内部的极短走线显著降低了从ASIC到光学器件的数据传输所需的功耗。一些供应商表示,对于超过 100Gbps 的 serdes 速率,可节省 30-50% 的功耗。此外,与LR serdes相比,XSR/VSR服务器在芯片上占用的面积更少。

随着联合封装技术的进步,PIC和ASIC芯片可以堆叠在一起的3D集成可以进一步减小封装尺寸和成本。

CPO 挑战

虽然联合封装已成为高端 ASIC(与 HBM、IO 小芯片等共同封装的开关芯片)的主流,但将 ASIC 与光子芯片联合封装存在多重挑战。

激光集成: 首先,将激光器集成在封装内的热开关芯片旁边需要对封装有严格的热/冷却要求,否则激光器可能会失效。制造商通常通过在 PIC 内部安装冗余激光器来弥补这一点,这增加了成本/面积。此外,并非所有供应商都集成了激光技术。一些供应商使用外部激光源来解决这个问题 - 他们将除激光器之外的所有光学元件封装在 PIC 中。移除激光器可使封装更小,并降低冷却要求。但是,将来自外部激光器的光束带到封装内部的 PIC 会带来挑战,需要额外的特殊光纤,这会增加封装的复杂性。此外,外部激光源将需要更高的功率来克服从激光器到PIC的路径中的光损耗,从而降低整体功率效率。

失去灵活性:可插拔光模块可实现现场维修,无需拆卸系统即可轻松更换故障模块。无论是板载光学器件(需要大量电路板返工)还是集成光学器件,这都是不可能的,因为无法从封装中移除 PIC。

但是,SiPh PIC经历了与硅芯片相同的严格设计和制造流程。设计过程是可重复的,并且有晶圆级测试来淘汰坏骰子。这将 100G 光学器件的缺陷率降低到 30 dppm 以下,并且 PIC 故障的可能性/现场可更换性需求非常低。

尽管存在一些挑战,但据估计,与ASIC芯片的共同封装光学器件可以为~51.2 Tbps的数据中心交换机节省约30%的功耗。在更高的吞吐量下,节能效果更好。随着交换机> 100Tbps 的变化,联合封装可能是降低系统功耗和提高前面板密度的唯一方法。

CPO解决方案还可以降低系统成本,因为它消除了对光笼的需求,简化了前面板设计,并且消除了需要单独购买的分立收发器的需求。

混合方法,即交换机芯片中的一些端口通过电气接口连接到前面板光模块,而其他端口直接连接到光纤,这也有助于在不完全消除可插拔模块提供的灵活性的情况下更顺畅地迁移。

共封装光学器件的网络行业适配

在过去的几年里,随着许多知名公司和初创公司的加入,集成光学生态系统得到了扩展。随着数据中心工作负载和更高带宽交换机的爆炸式增长,人们对这一领域重新产生了兴趣。

几年前,英特尔在共封装光学器件中使用其 Tofino2 交换机 (12.8Tbps) 展示了这项技术。在概念验证演示中,他们通过从Tofino到供应商系统中的可插拔光模块的共同打包光连接,将流量从Tofino交换机发送到另一家供应商的交换机。英特尔的 CPO 解决方案具有 51.2Tbps Tofino 交换机,也正在开发中。

目前,有几家初创公司提供光学 IO 小芯片,以实现与其他芯片的 CPO 集成。Ayar Labs 凭借其 OIO(光纤 I/O)小芯片产品引领了这项工作,该产品能够提供 2Tbps 带宽(八个端口,每个端口 256Gbps)。OIO芯片将收发器的所有光学/电气元件集成在PIC内部,但激光器除外。它们提供了一个单独的激光模块,可以为共同封装的光学器件提供光源。许多光学 IO 供应商更喜欢外部安装的激光源,以解决对激光可靠性和热管理的担忧。Ranovus是另一家提供具有100Gbps端口的光学小芯片的初创公司,并可选择集成激光器。

几家供应商已经宣布他们计划发布带有联合封装光学器件的芯片。BRCM宣布推出两款下一代交换平台,一个采用51.2Tbps交换ASIC,另一个采用25.6Tbps交换ASIC,采用共封装光学器件。虽然 25.6Tbps 的 CPO 方法的投资回报值得怀疑,但 BRCM 可能会利用它来推进该技术并鼓励其客户尽早适应。

思科和 Inphi 宣布合作,以 51.2Tbps 的速度将第一台 CPO 交换机推向市场。但是,目前尚不清楚 Marvel 最近收购 InPhi 的合作是否仍在进行中。

网络领域主要商业芯片供应商的这些公告似乎表明,该行业正在认真对待这一转变。在标准方面,OIF和COBO已经建立了项目,以在CPO标准方面取得进展。

人们一致认为,CPO 是降低数据中心高带宽交换成本/功耗的必经之路。数据中心向这些集成光学交换机过渡的速度有多快还有待观察。 这不是过渡是否会发生的问题,而是何时发生的问题.行业分析师预测,~200Tbps 交换机芯片的首次全面部署可能会在 2028 年发生。我们将不得不拭目以待......

虽然CPO有许多技术进步,但很难取代具有全行业适应性的可插拔光模块。这些模块将继续满足CPO在技术上不可行应用的需求,例如长途应用(核心/传输路由器或数据中心边缘)。在长距离通信中,通常需要大于 40 公里范围的光学器件,而使用共封装光学 IO 很难实现这一点,因为它们对使用高功率光子元件的面积和功率预算有严格的限制。

硅光子学/CPO的其他应用

使用硅光子学创建集成光学器件在网络行业之外也有应用。例如,在自动驾驶中,LiDAR(光探测和测距)用于周围环境的 3D 映射。它们通过发送短激光脉冲并记录出射光脉冲与来自周围所有物体的反射光脉冲之间的时间流逝来做到这一点。这些系统包含许多光学元件,是硅光子学集成的良好候选者。英特尔去年推出了SiPh激光雷达芯片。几家初创公司正处于激光雷达 PIC 开发的不同阶段。

光学器件可以集成在 CPU/GPU 封装中,以便在 HPC 系统中提供更快的互连。通过将光学器件引入 CPU 和内存,可以提高分解和分布式 HPC 系统的性能和能效,以处理更大的 AI/ML 工作负载。

实现更广泛的适应

虽然光子学IC设计利用了现有的硅晶圆代工厂生态系统,其中许多工具、工艺和仿真模型可以在这两个流程之间共享,但它仍然是一个利基领域,尚未被无晶圆厂半导体公司广泛使用。

为了实现更广泛的适应,许多 EDA 供应商已经接受了提供工艺设计套件 (PDK) 和协同设计工具的愿景,这些工具允许将电子和光子元件无缝集成到 IC 中。最近,Synopsys 和瞻博网络携手合作,提供集成激光器、光放大器和一整套光子组件,这些组件可通过 PDK 访问。晶圆代工厂和EDA供应商不断推动设计和制造的广泛普及,将引发该领域的更多创新。

总结

CPO 将看到更广泛的行业适应 很快真正,数据中心处于领先地位,交换机/智能网卡以及 CPU/GPU 可以与光学器件共同封装,以实现高性能/低功耗互连,从而节省大量成本。

一旦SiPh收发器和集成光学器件达到这些应用所需的范围,其他网络应用(核心/传输路由、长途通信)将紧随其后。

随着EDA供应商提供先进的PDK产品以及光学IO接口的标准化,将有更多供应商为光互连和其他光学功能(传感器、LiDAR等)提供SiPh PIC解决方案,这将加速该技术在多个行业的应用。

ADOP公司,全称为前沿光学科技有限公司(Advanced Optical Networking, ADOP),是一家专注于AI光交换设备和配件领域的供应商。他们利用InfiniBand和RoCE(RDMA over Converged Ethernet)架构,为全球客户提供成熟、可靠、高效的光互联产品和解决方案。ADOP的使命是通过创新技术,加速数据中心的性能,支持高性能计算(HPC)、人工智能(AI)、机器学习(ML)和大数据分析等先进应用。

公司成立于2013年,在2020年实现了品牌的全球部署,并在多个国家和地区成功运营。ADOP拥有一系列的国际标准认证,包括ISO 9001质量管理系统、ISO 14001环境管理系统、ISO 45001职业健康与安全管理系统,以及ISO 27001信息安全管理系统认证。

ADOP的产品线涵盖了储存系统、网络解决方案、智能影像分析等多个领域,致力于提供数字化定制的产品和方案,满足企业在云端时代的需求。他们的团队由行业资深专家组成,不断推动技术的边界,确保客户能够享受到最前沿的技术和最优质的服务。

ADOP - 前沿光学科技有限公司

前沿驱动创新,光学创造未来,ADOP与您精彩前行!🚀


*本文编译自瞻博网络技术专家兼高级工程总监Sharada Yeluri的博客

相关推荐
嵌入式郑工5 分钟前
LINUX驱动开发: 设备和驱动是怎么匹配的?
linux·运维·服务器
Jabes.yang36 分钟前
Java面试场景:从Spring Web到Kafka的音视频应用挑战
大数据·spring boot·kafka·spring security·java面试·spring webflux
rain bye bye1 小时前
calibre LVS 跑不起来 就将setup 的LVS Option connect下的 connect all nets by name 打开。
服务器·数据库·lvs
停停的茶1 小时前
深度学习(目标检测)
人工智能·深度学习·目标检测
Hello.Reader1 小时前
Flink 第三方序列化Kryo 注册、Protobuf/Thrift 接入与坑位避雷
大数据·flink
郭式云源生法则1 小时前
归档及压缩、重定向与管道操作和综合使用,find精确查找、find处理查找结果、vim高级使用、vimdiff多文件使用
linux·运维·服务器
Y200309161 小时前
基于 CIFAR10 数据集的卷积神经网络(CNN)模型训练与集成学习
人工智能·cnn·集成学习
老兵发新帖1 小时前
主流神经网络快速应用指南
人工智能·深度学习·神经网络
斯普信专业组1 小时前
使用Reindex迁移Elasticsearch集群数据详解(下)
大数据·elasticsearch
小池先生2 小时前
服务请求出现偶发超时问题,经查服务本身没问题,问题出现在nginx转发。
运维·服务器·nginx