网络

为 Microsoft Azure SONiC 选择 NVIDIA Spectrum

每个人都认为开放式解决方案是最好的解决方案,但真正开放的以太网交换机操作系统很少。在 NVIDIA ,我们拥抱了以太网交换机的开源。除了支持 SONiC ,我们还为开源社区项目贡献了许多创新。

这篇文章最初于 2018 年 6 月发布在 Mellanox 博客上,但已更新。

微软使用 Azure 运行着世界上最大的云之一。在构建和部署 Azure 的过程中,他们对管理全球、高性能、高可用性和安全的网络有了很多见解。

微软用于 Azure 的网络操作系统( NOS ) SONiC (云开放网络软件)是基于开源的。他们在数百个数据中心和数万台交换机上的经验让他们了解了需要什么:

  • 使用同类最佳的交换硬件。
  • 确保部署新功能不会影响最终用户。
  • 更新必须在数小时内安全可靠地在全球发布。
  • 使用云级深度遥测和自动化进行故障缓解。
  • 使软件定义的网络能够通过统一的结构快速调配和管理网络中的硬件元素,以消除重复并减少故障。

SONiC 是网络交换机操作和管理的突破,它满足了这些要求。微软将这项创新开源给社区,并在他们的 SONiC GitHub 存储库中提供。

SONiC 是一个独特的可扩展平台,拥有庞大且不断增长的硬件和软件合作伙伴生态系统,提供多种交换平台和各种软件组件。

SONiC 系统的体系结构包括多个模块,这些模块通过集中式可扩展的基础设施相互交互。该基础设施依赖于 Redis 数据库引擎,该引擎允许所有 SONiC 子系统之间的数据持久化、复制和多进程通信。

Redis 引擎基础架构依赖于发布者/订阅者的消息传递范式,因此应用程序只能订阅它们所需的数据视图,避免了与它们的功能无关的实现细节。

Diagram shows the configuration and management tools plus network applications working on the SONic base.
图 1.SONiC 架构

有关 SONiC 架构的更多信息,请参见 SONiC wiki 中的 架构

NVIDIA Spectrum 交换机支持多种第 2 层和第 3 层网络连接和管理功能。表 1 显示了 SONiC 当前支持的功能。

L3 L2 Management
BGP LAG SNMP
ECMP LLDP Syslog
DHCP Relay ECN NTP
IPv6/4 PFC CoPP
  WRED TACACS+
  CoS Sysdump
  Mirroring  
  ACL  
     
表 1.当前支持的功能

为什么要将 NVIDIA Spectrum Switch 与 SONiC 一起使用?

当选择一个交换机在顶部运行 SONiC 时,您应该考虑两个主要因素:

  • 交换机供应商是否能够支持您的部署、 ASIC 、交换机抽象接口( SAI )和软件?
  • 下面运行的 ASIC 的功能是什么?

基于 NVIDIA Spectrum ASIC 的交换机

NVIDIA 开放式以太网交换机产品组合完全基于 Spectrum ASIC ,提供市场上最低的 25G / 100G 延迟、零数据包丢失和完全共享的缓冲区。它是满足云网络需求的理想组合。

SONiC 通过其独特的驱动程序解决方案与 Spectrum ASIC 合作。 SONiC 使用 SAI ,这是一种由 NVIDIA 共同发明的开源驱动程序解决方案。 Spectrum 的这种开放能力也意味着任何 Linux 发行版都可以在 Spectrum 交换机上运行。

NVIDIA 是唯一一家将 ASIC 驱动程序直接提供给 Linux 内核的交换机硅供应商,支持 SONiC 和任何标准 Linux 发行版(如 Red Hat 或 Ubuntu )的混合,可以直接在交换机上运行。

Image shows multiple company logos  under sections labeled Application & Management Tools, SONiC, and SAI.
图 2.SONiC 开发社区

NVIDIA 是唯一一家参与 SONiC 开发社区各个层面的公司。我们是最早开发和采用 SAI 的公司之一。 SONiC 完全支持所有频谱系列交换机,可以部署在我们的以太网产品组合中的任何交换机上。我们也是 SONiC OS 功能集的主要积极贡献者。

Pictures of SN2700, SN2410, and SN2100 switches.
图 3. NVIDIA 交换机

所有 NVIDIA 网络平台都支持通过 SONiC OS 进行端口拆分,这是目前唯一支持此功能的平台。与使用真实的混合帧大小、“噪声邻居”和微突发吸收场景的商品硅基交换机相比,频谱交换机还提供了优异的网络性能。

有关 NVIDIA Spectrum 和 Broadcom Tomahawk 交换机之间的根本差异以及我们无与伦比的 ASIC 性能的更多信息,请参见 Tolly Performance Evaluation: NVIDIA Spectrum-3 Ethernet Switch

NVIDIA Spectrum 交换机系统是理想的主干和机架顶部解决方案,具有灵活性,每个端口的端口速度从 10 Gb / s 到 100 Gb / s 不等,端口密度可实现以任何速度与每台服务器的全机架连接。这些基于 ONIE 的交换机平台支持多种操作系统,包括 SONiC ,并利用开放网络分解和 NVIDIA Spectrum ASIC 功能的优势。

频谱自适应路由技术支持各种网络拓扑。对于 CLOS (或叶/脊)等典型拓扑,多条路径到给定目的地的距离是相同的。因此,交换机通过拥塞最少的端口传输数据包。

在路径之间距离不同的其他拓扑中,交换机更喜欢通过最短路径发送流量。如果拥堵发生在最短路径上,则选择拥堵最小的备选路径。您可以使用 NVIDIA 交换机作为构建块来构建高性能 CLOS 数据中心。

类似地,边界网关协议( BGP )是一种路由协议,负责查看数据可以传输的所有可用路径并选择最佳路径。 BGP 使通信能够快速高效地进行。

Diagram shows 32 switches linked with pods by eBGP. Layer 3 ECMP, all links active/active, with very small fault domains.
图 4.以 BGP 为路由协议的典型叶脊吊舱设计

频谱开关启用 POD 。 POD 是一个网络、存储和计算单元,它共同提供网络服务。 POD 是一种可重复的设计模式,可提供可扩展且更易于管理的数据中心。

Diagram shows switches linking to multiple clusters and pods.
图 5.扩展到多个 POD

最后, Spectrum 系列支持一组先进的网络功能,使交换机能够灵活应对不断发展的网络技术。这包括未来可能开发的新协议,支持自定义应用、高级遥测和新的隧道/覆盖功能。 Spectrum 将可编程、灵活、大规模并行的分组处理管道与完全共享和有状态的转发数据库相结合。频谱还具有世界上最有用的开关遥测技术“刚刚发生的事”( WJH )。

有关更多信息,请参阅以下资源:

 

Tags