网络

在中国移动 Bigcloud 加速云原生应用

 

云计算旨在灵活、有弹性地为企业提供附加价值。中国移动( CMCC )是中国最大的电信运营商和云服务提供商之一,正是通过其 Bigcloud 公共云产品提供了这一服务。

Bigcloud 为任务关键型应用程序提供 PaaS 和 SaaS 服务,以满足企业云和混合云解决方案的需求。中国移动深知,企业依赖其网络和通信基础设施,在日益频繁的数字世界中保持竞争力。

当他们开始体验到对云本机服务的巨大需求时,中国移动通过开放 vSwitch ( OVS )转向网络抽象和虚拟化,以自动化并获得对其网络的动态网络控制,帮助处理他们不断增长的需求。

然而,由于东西向网络流量的增加,维持网络性能成为一个严重的挑战。

Virtual sprawl produced an explosion of east-west traffic that the created increased network congestion.
图 1.Bigcloud 网络解决方案

识别网络挑战

随着云服务的大量采用,中国移动在其虚拟化环境中经历了巨大的增长。这种虚拟的蔓延在其数据中心内的服务器之间产生了东西向流量的爆炸。

由于网络流量的增加,他们还看到了网络拥塞的增加,导致更高的抖动和延迟,并阻碍了整体网络吞吐量和应用程序性能。这导致了有效带宽不足,他们无法跟上高峰业务时间的大量网络流量。

在中国移动调查这些挑战的原因时,他们确定这些问题的根源来自开放式交换机的四个主要问题:

  • 由于服务器 CPU 同时处理应用程序和网络请求, VXLAN 封装和解封规则处理的 vSwitch 容量效率低下。
  • 由于在用户空间、内核空间和内存之间频繁切换上下文,导致基于内核的 vSwitch 转发性能较差,从而产生数据复制开销。
  • 基于 DPDK 的 vSwitch 转发造成了对服务器 CPU 资源的竞争,这些资源已经受到严重限制。
  • 由于过度的数据包丢失、抖动和延迟导致吞吐量降低, vSwitch 流规则能力有限。

这些挑战成为了瓶颈,阻碍了应用程序在尽可能低的延迟下获得所需的高网络流量吞吐量。

虽然 OVS 允许在主机之间以及外部世界之间转发数据包和流规则,但它是 CPU 密集型的,并通过消耗 CPU 内核来影响系统性能,这些内核应用于客户应用程序,并阻止充分利用可用带宽。

中国移动希望确保网络应用程序的响应时间保持较低,交付的带宽保持一致,并且能够满足峰值需求。

CMCC used OVS and OVS DPDK to support a highly efficient SDN network.
图 2.CMCC 在希望支持 OVS 和 OVS-DPDK 的大云 vSwitch 转发方面面临挑战

中国移动聘请了这一领域的两位专家, NVIDIA 和诺基亚,他们共同提供了一种高效的软件定义网络( SDN )解决方案。该解决方案结合了 NVIDIA ConnectX SmartNIC 和 NVIDIA 的负载、性能和效率 BlueField 数据处理器 ( DPU )技术,具有 Nuage Networks 虚拟化服务平台( VSP )的灵活性、弹性和自动化。

NVIDIA 和 Nuage 一起减轻了与 OVS 相关的计算密集型数据包处理操作,并释放了昂贵的计算资源,因此它们可以运行应用程序而不是 SDN 任务。

SmartNIC 和 DPU 供电的加速网络

NVIDIA ConnectX 系列 SmartNIC 和 BlueField 系列 DPU 提供 NVIDIA 加速交换和数据包处理( ASAP 2) 该技术在 NIC 硬件内运行 OVS 数据平面,同时保持 OVS 控制平面完好无损,对应用程序完全透明。

ASAP2有两种模式。在第一种模式中,硬件数据平面构建在 SR-IOV 虚拟函数( VF )之上,因此每个网络 VF 直接连接到其相应的 VM 。

也支持的另一种方法是通过虚拟数据路径加速( vDPA )进行虚拟加速。 VirtIO 允许虚拟机对硬件设备(如网络适配器)进行本机访问,而 vDPA 允许通过在网络设备和标准 VirtIO 驱动程序之间构建的 OVS 数据平面,通过称为 Virtqueue 的设备队列建立与 VM 的连接。这使得虚拟机和加速网络之间能够无缝集成,控制平面在主机上进行管理,而虚拟数据平面由 smartNIC 硬件加速。

BlueField DPUs provide hardware offload and acceleration to reduce network congestion
图 3.vDPA 使用 SmartNIC 硬件为每个虚拟机卸载和加速流量 .

Nuage Networks SDN 与 NVIDIA vDPA 技术的无缝集成

Nuage Networks 通过其 虚拟化服务平台 ( VSP )对解决方案做出贡献。 VSP 执行虚拟路由和交换,是基于开放 vSwitch 的分布式转发模块,用作网络服务的虚拟端点。 VSP 立即识别计算环境中的任何变化,触发网络连接和配置中基于策略的即时响应,以确保应用程序性能。

Nuage Networks 的 VSP 使用 VXLAN 等隧道协议将原始有效负载封装为覆盖 SDN 解决方案。

由于标准 NIC 不识别新的数据包头格式,传统上所有数据包操作都必须由 CPU 执行,这可能会使 CPU 负担过重,并导致网络输入/输出性能显著下降,尤其是随着服务器输入/输出速度的增加。

因此,覆盖网络处理需要卸载到一个特定于 I / O 的硬件适配器上,该适配器可以处理 VXLAN ,如 ConnectX 或 BlueField ,以减少 CPU 压力。

vDPA 的性能优势

ASAP2 uses hardware acceleration to increase performance compared to OVS DPDK.
图 4.OVS-DPDK 在软件和 ASAP 中的性能比较2vDPA 硬件加速.

中国移动决定采用 VirtIO 解决方案以实现最大的兼容性,他们希望能够根据使用情况选择纯 OVS 或 OVS DPDK 。通过合作, Nuage Network 和 NVIDIA 为中国移动的公共云提供了一个 SDN 解决方案,该解决方案灵活、可扩展、硬件加速,支持两种类型的网络虚拟化。

使用 Nuage Networks VSP 和 NVIDIA 硬件加速 vDPA 的联合解决方案提供了显著更快的性能。与单独在软件中运行 OVS-DPDK 相比,网络吞吐量增加了 1.5 倍,数据包转发速度加快了 3 倍, Apache 基准每秒支持的请求数增加了 7 倍。

了解更多信息

有关 OVS 卸载技术之间差异的更多信息,中国移动为什么决定使用 VirtIO / vDPA 解决方案,以及 NVIDIA 如何帮助您提高云原生技术的效率,请参阅中国移动、 Nuage Networks 和 NVIDIA 之间的 通过虚拟数据平面加速网络,增强云本地应用程序 联合 GTC 会议。

 

Tags