网络/通讯

NVIDIA 硅光网络交换开启数据中心网络新时代

NVIDIA 通过将硅光技术直接与 NVIDIA Quantum 和 NVIDIA Spectrum 交换机 IC 集成,开辟了新的领域。在 GTC 2025 上,我们推出了全球领先的硅光交换机系统,采用先进的 200G SerDes 技术,与传统的可插拔光模块相比,这种创新的硅光一体封装技术具有显著的优势,例如3.5 倍的能耗降低、延迟的降低、以及显著的网络可靠性提升等,这些都是加速大规模 AI 模型开发和推理的关键因素。

什么是硅光一体化封装?

硅光一体化封装技术是硬件集成的一次演进。通过将硅光光收发器直接与交换机 IC 封装在一起,NVIDIA 实现了:

降低功耗:与传统的可插拔光模块相比,硅光一体化封装可实现3.5 倍的大幅功耗降低。通过消除耗电的外部 DSP 器件和将信号路径从英寸缩小到毫米,这项突破性技术可显著提高能效。这种更密集、更可持续的 AI 基础设施,将推动更快的系统可见性和扩展性,以满足新一代的 AI 的需求。

减少组件数量:减少部件数量意味着简化制造流程,减少故障点。将光器件直接集成到封装中,降低了采购、组装和测试大量微小部件的复杂性,这是传统基于光模块的系统经常面临的问题。

增强性能:集成光器件后,交换机 ASIC 和光收发器之间的连接将在 IC 封装层面进行设计、组装和测试,消除了信号衰减的来源,也消除对独立的数字信号处理器(DSP) 的需求,DSP往往会引入延迟并消耗额外的电力。

简化数据中心运营: 简化施工可加快部署速度并简化维护。

基于 NVIDIA 硅光技术交换机的主要优势

以下是 NVIDIA 硅光网络交换机为现代数据中心带来的突出优势。

更低的功耗

传统模块使用的 DSP 会显著增加功耗。例如,一个1.6 Tbps 的光模块大约需要 30 瓦的供电,其中一半以上会消耗在DSP 上。

通过利用 NVIDIA 集成硅光技术,长期而言,AI 数据中心的能耗比基于传统光模块可节省 3.5 倍。

增加网络正常运行时间和可靠性

传统光模块出现故障时,可能需要花费数小时的人工干预来进行故障排除和维修。相比之下,硅光一体化封装技术采用更简单的设计,组件更少,可显著降低光模块发生故障机率。这种集成设计可更大限度地减少 AI 数据中心宕机时间,提高网络可靠性,确保网络保持全面运行,这对于不能间断的 AI 训练和推理至关重要。

更低的延迟和更好的信号完整性

NVIDIA 硅光技术将光信号器件直接集成到交换机 IC 封装中,通过减少元器件数量和大幅缩短信号路径来提高信号完整性。在传统基于光模块的交换机中,信号需要通过印刷电路板或铜线传输 14至16 英寸,从而增加了信号被干扰的风险。采用硅光技术,信号路径才不到 0.5 英寸,大大降低了这种风险。

基于光模块的交换机还依靠 DSP(数字信号处理器)来清除信号干扰,这会显著增加延迟。通过将硅光器件直接集成到交换机 IC 中,消除了这种额外的处理过程,从而降低延迟并提高网络效率,这对于高速 AI 工作负载和现代数据中心性能至关重要。

加快部署速度

与使用可插拔光模块部署的类似系统相比,采用硅光一体化封装技术后,系统安装成为一个简单的“开箱即安装”过程,部署速度提高了 1.3 倍。

易于现场维修

该设计将最容易发生故障的组件 (即激光器) 放置于交换机前面板的 OSFP 模块内,以便于外部激光源 (ELS)插拔,如果发生故障,可以快速诊断和轻松更换。

创新故事:协作与突破

硅光一体化封装技术的开发历经多年的努力 (历时四年) ,其中包括数百项专利的贡献以及与我们生态系统创新合作伙伴的合作。

自 2016 年合作开始,NVIDIA 不断突破技术极限,制定了 AI 网络所需的一些非常严格的行业技术规格。

硅光 CPO 制造、封装和测试

TSMC TSMC 的硅光紧凑型通用光子引擎(COUPE)工艺使用 3D 晶圆上芯片堆叠(CoW)及芯片堆叠封装技术将电子集成电路(EIC)与硅光集成电路(PIC)集成在一起。

SPILSPIL 公司以封装复杂的集成组件而闻名,NVIDIA CPO 多芯片模组的晶圆凸块、晶圆筛选、组装和测试就在这里完成。

ELS 激光器及其配件

LumentumSumitomo Coherent这些硅光引擎供应商提供 ELS 的组装、光学对准和测试。

光纤、连接器和微光学

Browave, Corning, Senko, TFC Communication Coherent这些光连接器和光纤组件的行业专家,负责 ELS 激光器与偏振的结合,光纤在硅光引擎中的集成与维护,并将数据输出到前面板等。

交换机封装

Foxconn Fabrinet 这些合作伙伴擅长于系统级 CPO 组装和测试,以及将交换机CPO 组件及其配件集成到交换机系统机箱内。

总结

NVIDIA 基于硅光技术的网络交换标志着数据中心网络的突破性转变,通过将光收发器直接与交换机 IC 集成,这项创新可实现 3.5 倍的功耗降低、更低的延迟和前所未有的网络可靠性——所有这些对于支持下一代 AI 应用至关重要。凭借更快速的部署、简化的设计和更长的正常运行时间,NVIDIA 不仅树立了新的行业标准,还重新定义了高速、可持续和可扩展的数据中心基础设施的未来。这是效率与性能交汇的新时代的黎明,加速 AI 突破,并为后代重塑数据中心格局。

详细了解 NVIDIA 硅光技术

标签