AI 平台/部署

行业协作共推 NVIDIA CPO 技术

NVIDIA 通过光、电组件的无缝集成,重塑数据中心互连新格局。这一突破的关键在于与整个行业的合作伙伴的紧密合作。

NVIDIA 网络平台整合了来自领先合作伙伴的各种前沿技术,特别在先进的制程工艺、尖端的激光技术以及最新的光纤到芯片方案等。通过全面协调整体方案设计的各个环节,NVIDIA 不仅整合了世界一流的硬件,还集成了可扩展、高可靠且高性能的光系统所需的各种技术,形成了一个完整的生态系统,满足了日益增长的数据吞吐量和节能设计需求,为未来光互连技术树立了新标准。

加入我们,深入探索 NVIDIA CPO平台背后的技术创新、生态合作以及技术基石——光芯片、电芯片、光纤、封装、连接器和激光源等。通过剖析这些前沿科技,我们将全面揭示 NVIDIA 生态系统如何推动可扩展、高能效的 AI 工厂互连的未来发展。

TSMC 助力攻克MRM(微环调制器)难关

CPO技术创新的核心在于 NVIDIA 的MRM(微环调制器)硅光引擎,这是一项可以重新定义光互连的密度和效率的突破性技术。在每个波长采用 200Gbps PAM4 直接调制的设计中,采用 MRM 可以显著降低空间占用,从而在保持物理面积紧凑的同时实现卓越的数据吞吐能力。这种高度集成技术是设计新一代数据中心交换机和处理器所追求的封装尽量小、功耗尽量低和散热易管理的关键。

与台积电(TSMC)的深度合作,帮助 NVIDIA 成功解决了MRM在大规模生产上长期存在的多项制造难题,包括制造过程的精确控制、缓解热敏感度的影响以及高速调制的一致性。通过先进的制程工艺与精细的控制技术,NVIDIA 与 TSMC 实现了稳定且可重复的性能表现,确保即使在极小的几何面积,每个调制器都能满足超大规模部署所要求的严苛标准。

MRM的独特之处在于兼具小巧的尺寸与出色的热控性能。这种在尺寸与稳定性上的完美结合,突破了传统体积较大的调制器所带来的设计局限,释放了在单个封装内光互连吞吐量实现多通道扩展的潜力。由此,得以构建高密度的高速互连阵列,在不增加功耗与散热负担的前提下,显著提升每个设备的带宽。

通过紧凑、优化的光电引擎提升能效

当光路和电路被封装在一起时,,可最大限度地减少相关信号损失。通过将CMOS与光组件在彼此间距仅几微米的空间内堆叠封装在一起,且,实现了超高密度和高效率的集成。既降低了功耗,又为超大规模数据中心环境所需的既紧凑、又容易管理散热模块化设计创造了条件。

微透镜的晶圆级集成缩短了光纤对准过程的时间和降低了对精度的敏感性。这一进步简化了制造流程,提升了可扩展性,使得高性能光模组的晶圆级制造成为可能。

通过模块化光学子组件保障快速部署

Quantum-X Photonics 交换机采用了一种专为新一代数据中心提供前所未有的带宽与连接能力的精密光学子组件,。每个光学子组件设计可支持 4.8 Tbps 的发送带宽和 4.8 Tbps 的接收带宽,成为实现超高容量光数据传输的关键基石,其核心在于三个基于 COUPE 技术的光引擎,每个引擎均可提供 1.6 Tbps 的发送和 1.6 Tbps 的接收吞吐量。这些光引擎通过先进的光电电路集成在一起,利用TSMC 的 COUPE 技术,不仅实现了高度紧凑的联合封装,还具备出色的功率效率和热效率。

每个光引擎支持发送和接收各8个200Gbps 的PAM4通道,实现了8发和8收的并发,每个光引擎内置2个激光输入光纤接口。该配置确保了交换机网络与光接口之间具备低延迟、高吞吐量的通信能力,可直接满足AI驱动和超大规模环境的需求。该组件的一项重要进步在于采用基于插槽的设计,实现了从电气接口到主交换机封装的模块化连接,支持现场的快速部署与维护。

与此同时,子组件与光学引擎之间的光纤接口采用全密封设计。这种防污染的气密结构能够确保长期的可靠性和性能,即使在运营需求不断增长的情况下亦能稳定运行。

图 1。Quantum-X Photonics 交换机,采用CPO的光学子组件。

每个 Quantum-X 交换机 ASIC 通过六个高容量光学子组件提供 28.8 Tbps 的全双工带宽。这些子组件无缝集成在交换机封装的内部接口上,确保了高密的电热耦合,实现了在这一高度集成的架构中为交换芯片及所有光学模块提供高效的液冷效果。Quantum-X Photonics 液冷交换机系统 Q3450 搭载四个 Quantum-X 芯片,可在 144 个端口上提供总计 115.2 Tbps 的全双工带宽,每个端口速率为 800 Gbps,为 NVIDIA AI 工厂提供低延迟和卓越的可扩展性。

Spectrum-X Ethernet Photonics 多芯片模组封装实现了迄今为止最密集的光电集成,单个紧凑空间内集成了 32 个硅光引擎。每个光引擎均配备 16 个发送通道和 16 个接收通道,单引擎可提供高达 3.2 Tbps 的带宽,总聚合带宽更是前所未有。

这些先进的引擎直接通过回流焊直接焊接至模组基板,确保在大规模制造中实现可靠的电气连接和卓越的稳定性。该设计能在一个小封装内支持512个200Gbps吞吐量的通道,在优化功耗与散热管理的同时,显著提升了数据通道密度。

该模组采用可插拔式光学连接器,实现与外部的无缝连接,提升了装配良率,支持完全自动化的大规模制造流程。这种创新接口不仅简化了光纤连接,还确保了连接的精度与可重复性。使 Spectrum-X Ethernet Photonics 封装成为超大规模数据中心和新一代 AI 基础设施的变革性解决方案。

外部激光源如何在 Photonics Switch 中实现可靠、可扩展的光源

在 Quantum-X Photonics 和 Spectrum-X Ethernet Photonics交换机中,支撑光学性能的核心是其先进的外部激光源(ELS)模块,一种高功率,可更换的组件,重塑了激光源是如何将光传输到内置光引擎的方式。ELS 模块位于独立于主交换机机箱的专用热控环境中,确保每个激光器均在稳定的散热条件下运行。这不仅有效减少了波长漂移,还能缓解老化机制可能导致的早期故障。

这种方法解决了传统数据中心光学系统中长期存在的一个可靠性瓶颈:反复的热循环会显著缩短激光器的使用寿命,导致昂贵的网络中断和维护问题。

NVIDIA 采用的高功率 ELS 模组,使 Quantum-X Photonics 和 Spectrum-X Ethernet  Photonics 交换机能够集中生成光源,相较于传统设计,数据中心的激光器总数减少了 4 倍。这种集成化设计不仅降低了投资和运营成本,还减少了因单个激光器故障导致的网络中断风险。

每个ELS模块均采用模块化设计,支持现场更换,使数据中心运营商能够在不干扰周边交换机基础设施的情况下更换ELS。该模块化设计兼容标准调制器外形规格,有助于简化维护流程,实现快速故障隔离,从而在最大限度减少服务中断的同时,确保网络的完整性。

每个ELS包含八个高质量激光器,这些激光器通过光纤精确耦合至光学引擎。单个ELS可支持Quantum-X交换机的576个发送通道中的32个通道,为CPO光引擎提供稳定且分布式的光源,实现无与伦比的带宽密度,从而让Quantum-X Photonics平台在同类产品中脱颖而出。Spectrum-XEthernet Photonics交换机将采用相同的ELS模块,其中单ASIC版本使用16个模块,四个ASIC的版本则使用64个模块。

视频 1。一段视频,展示了 NVIDIA Quantum-X Photonics 交换机连接到 NVIDIA GB300 NVL72 机框级 AI 超级计算机的情况。

详细了解 NVIDIA CPO 平台 

Quantum-X Photonics 和 Spectrum-X Ethernet  Photonics 是 NVIDIA 与生态系统合作伙伴多年携手创新的成果。这些一体封装的交换机能够应对硅材料与晶体管层面的复杂挑战,同时在散热管理、可靠性、大规模光纤与芯片集成,以及激光性能一致性等方面表现出色。

Quantum-X Photonics 和 Spectrum-X Ethernet  Photonics 是支撑新一代 AI 工厂的关键支柱,能够实现高度可靠且节能高效的网络基础设施。通过融合模块化设计、高能效与稳健的工程架构,这些平台可确保数据中心无缝扩展,满足 AI 驱动应用的指数级增长需求,进一步巩固 NVIDIA 在未来数据中心连接领域的领导地位。

如需了解更多信息,请访问 查看之前的 CPO 技术博客我们的视频介绍了如何深入研究CPO交换机,或查看 访问我们的硅光网站,以获取持续的公告和产品发布更新。

标签