数据中心/云端

云计算中的 RAN :向 5G RAN 提供云经济

5G 部署在全球范围内不断加快。许多电信运营商已经推出了 5G 服务,并且正在快速扩张。除电信运营商外,企业对使用 5G 建立专用网络也非常感兴趣,这些网络利用更高的带宽、更低的延迟、网络切片、 mmWave 和 CBRS 频谱。

5G 的崛起恰逢一个有趣的时刻。在过去二十年中,云计算已经成熟,成为开发人员构建应用程序的首选。云提供了许多优势,包括成熟的软件工具、自动化和编排、业务灵活性和较低的总体拥有成本( TCO )。

此外,各个领域的应用(工业机器人、云游戏、智能城市、安全、零售、自动驾驶、智能农业)越来越多地使用人工智能( AI )来实现变革性体验。 5G 、云计算和人工智能的融合将在未来十年推动许多创新。

NVIDIA Aerial SDK 是构建虚拟无线电接入网络( vRAN )的关键技术基础。它是一个由软件定义的完整 5G 第 1 层( L1 )卸载,在 NVIDIA GPU 中实现在线加速。它还实现了所有符合 3GPP 和 O-RAN 的接口。由复杂信号处理算法组成的 L1 软件在 CUDA C / C ++中实现,使优化 L1 算法、实现新功能以及 5G 演进和 6G 的未来验证 RAN 应用变得容易。 NVIDIA Aerial SDK 作为模块化微服务实现,采用 E2E 云原生架构,由 Kubernetes 使用标准 ORAN SMO 兼容接口进行管理。

从 CloudRAN 到云中的 RAN

最近有很多关于 CloudRAN 的讨论。作为加速计算平台和云计算领域的行业领导者, NVIDIA 一直处于 CloudRAN 创新的前沿。许多行业领导者正在使用术语 CloudRAN 来表示无线电接入网络( RAN )的云原生实现。

虽然云原生技术是关键,但重要的问题是 CloudRAN 是否等同于使用云原生技术。我们认为事实并非如此。我们认为,真正的云 RAN 具有部署在云中的所有计算元素( vDU 、 vCU 和 dUPF )。因此,术语“云中的 RAN ”是指在多租户云基础设施中作为服务完全托管的 5G 无线电接入网络。

为什么这一区别很重要,云 RAN 的动机是什么?首先, RAN 是电信运营商最大的资本支出和运营支出。它也是最未充分利用的资源,大多数无线电基站的使用率通常低于 50% 。将 RAN 计算迁移到云带来了云计算的所有好处:共享云基础设施中的池化和更高的利用率,为电信运营商带来了最大的资本支出和运营支出减少。

带有 GPU 加速器的 COTS 平台不仅可以加速 5G RAN ;它还可以加速边缘 AI 应用。电信运营商和企业越来越多地使用 NVIDIA GPU 服务器来加速边缘 AI 应用。除了 AI 应用之外,这提供了使用相同 GPU 资源加速 5G RAN 连接的简单途径。这反过来降低了 TCO ,并为建立企业 5G 网络提供了最佳路径。

多年来,云软件、工具和技术已经成熟,除了可靠性、可观测性和服务保证外,还提供了规模自动化、降低能耗、弹性计算和按需自动缩放的好处。

Graphic illustrating how the traditional siloed data centers designed for enterprise and telco applications can converge into a unified accelerated software-defined data center of the future, which can also host RAN-in-the-Cloud. Accelerated computing platforms with NVIDIA GPUs are at the heart of this convergence.
图 1 。统一加速数据中心

需要注意的是,一些供应商正在为 RAN L1 卸载设计基于专用集成电路( ASIC )的固定功能加速卡。基于这些基于 ASIC 的加速器构建的 RAN 类似于固定功能设备。它只能执行 RAN L1 处理,并且在不使用时是一个浪费的资源。

具有通用 GPU 加速服务器的 NVIDIA Aerial SDK 提供了一个真正的多服务、多租户平台,可用于 5G RAN 、企业 AI 和部署在云中的其他边缘应用程序,具有上述所有优势。

云原生作为云 RAN 的基础

随着行业加速 5G 部署,实现 5G 的全部商业价值需要可扩展和灵活的解决方案。将 RAN 软件与硬件分离,并使软件在云中可用和部署,有可能推动更快的创新和新的增值服务。

云原生 vDU / vCU RAN 软件套件设计为完全开放和自动化,用于部署和整合操作,支持私有、公共或混合云基础设施上的 3GPP 和 O-RAN 接口。它利用了云原生架构的优势,包括水平和垂直扩展、自动修复和冗余。它还针对移动网络演进进行了优化设计,包括 6G 等下一代无线技术。

NVIDIA Aerial SDK 云原生架构有助于将 RAN 功能实现为 Kubernetes 编排和管理的容器中的微服务。模块化软件支持:

  • 改进了软件升级、发布和修补的粒度和速度
  • 遵循 DevOps 原则的独立生命周期管理,具有持续集成和持续交付( CI / CD )
  • 不同 RAN 微服务元素的独立缩放
  • 应用级可靠性、可观测性和服务保证
  • 通过网络自动化简化操作和维护

要获得真正的云原生 RAN 体验,云、边缘平台和网络都需要发展。在我们看来,对于云原生容器化 RAN 软件栈的商业可部署性而言,许多要求至关重要,包括:

  • 时间同步
  • CPU 亲和性和分离
  • 拓扑管理和特征发现
  • 多个网络接口
  • 高性能数据平面和加速硬件
  • 低延迟、 QoS 保证和高吞吐量
  • 远程分布式部署
  • 零接触配置
  • Kubernetes 操作员框架和加速器设备的生产就绪操作员

NVIDIA GPU Operator 使用 Kubernetes 内的操作员框架来自动管理提供 GPU 所需的所有 NVIDIA 软件组件。这些组件包括设备驱动程序(启用 CUDA )、 GPU 的 Kubernetes 设备插件、 NVIDIA 容器运行时、自动节点标记、基于数据中心 GPU 管理器( DCGM )的监控等。

GPU 运算符使 Kubernetes 集群的管理员能够像管理集群中的 CPU 节点一样管理 GPU nodes 。管理员可以依赖 CPU 和 GPU 节点的标准 OS 映像,然后依赖 GPU Operator 为 GPU 提供所需的软件组件,而不是为 GPU 节点提供特殊的 OS 映像。

利用 Kubernetes CRD 和运营商 SDK ,它管理与网络相关的组件,以实现与 RDMA 和 NVIDIA GPUDirect 的快速网络连接,用于 Kubernete 集群中的工作负载。网络运营商与 GPU 运营商合作,在兼容系统上启用 GPU 直接 RDMA 。网络运营商的目标是管理网络相关组件,同时在 Kubernetes 集群中执行 RDMA 和 GPU 直接 RDMA 工作负载。

NVIDIA Aerial SDK 基于微服务和云原生架构构建,为在云中构建和部署 5G RAN 提供了坚实的基础。

在云中构建、部署和管理

O-RAN 联盟计划将传统无线基站分解为 RRU 、 vDU 和 vCU 实例,并在它们之间定义良好的接口,这将产生一个具有供应商选择的更大生态系统。此外,云原生容器化软件支持由 Kubernetes 和 SMO 管理的可组合和自动化 RAN 。云化并在云中托管完整的 RAN as a service 需要什么?

Graphic illustrating how all processing elements of a RAN can be hosted in the cloud. The SW defined front haul terminates the fiber connectivity from RRU (Remote Radio Unit) and brings all data into vDU running as a container POD in a data center. Other elements such as vCU, dUPF, and 5G core are all hosted in the cloud as containerized services.
图 2 :云愿景中的 RAN

部署 5G 的经济性一直具有挑战性。与前几代无线技术相比, 5G 正在推动更高的 RAN 资本支出增长。预计未来 5 年内,细胞站点的数量将增加一倍。因此, RAN 资本支出占总体总体拥有成本的比例从 45-50% 增加到 65% 。有关详细信息,请参见 Wireless Backhaul Evolution5G-era Mobile Network Cost Evolution

此外,众所周知, RAN 传统上被提供用于峰值容量,这导致宝贵计算资源的显著使用不足。突发性和时间依赖性流量意味着许多传统 RAN 站点的平均容量使用率低于 25% 。如果 RAN 可以托管在云中,则池化的好处可以减少与节能相关的 OpEx 并提高使用率。此外,可以为其他应用程序和工作负载以真正类似云的方式重新配置未使用的资源。

仅在美国,将 420K 个蜂窝基站中的 50% 移动到 GPU 加速云可能会为电信运营商带来巨大的新收入机会。当 RAN 利用率低且 GPU 未使用时,它们可用于多租户云环境中的企业 AI 、视频服务和其他边缘应用。这可能会在全球带来新的数十亿收入机会。

图 2 显示了使用 NVIDIA GPU 的加速计算基础设施构建的数据中心如何加速许多应用程序,提供云经济性和最佳总体拥有成本。

NVIDIA AI EnterpriseNVIDIA Base Command PlatformNVIDIA Fleet Command 软件使企业能够在 NVIDIA GPU 云中运行 AI 应用程序,利用各种垂直细分领域的所有预构建和强化软件。 5G 连接作为一种容器化解决方案,与其他使用相同基础设施的 AI 应用程序一起运行,对企业来说将是极其强大的。这将改变世界对无线连接的看法。 5G 将成为一种完全基于云的服务,可按需部署。这是云中 RAN 的本质。

使用 NVIDIA 在云端构建 5G RAN

集中 RAN 并将其完全部署在云中有五个关键要素,如图 3 所示。

Figure showing five key requirements of RAN-in-the-Cloud and how NVIDIA is building solutions to address these key requirements: 1) SW-defined front haul 2) general-purpose GPU accelerated servers 3) SW-defined stack 4) O-RAN-compliant SMO, and 5) end-to-end orchestration framework.
图 3 。实现云 RAN 的五项关键技术

新的 NVIDIA Spectrum SN3750-SX Open Ethernet Switch 是云解决方案中 RAN 的关键组件。它基于 NVIDIA Spectrum-2 以太网 ASIC 构建,是有史以来第一个软件定义的 xHaul 交换机,能够提供电信数据中心所需的前端、中间和后端网络。

该交换机的一个关键功能是,它可以被动态编程以将流量路由到数据中心中支持自动缩放和按需 RAN 部署的任何服务器上部署的任何 vDU 。这是第一个将电信和人工智能在同一基础设施上运行所需的所有功能结合起来的交换机。 SN3750-SX 支持高级定时协议,如电信级精确时间协议( PTP )、同步以太网( SyncE )和 PPS (每秒数据包),以及动态 RU / DU 映射。

为了实现 AI 训练,交换机支持低延迟 200G 带宽以实现最高吞吐量。 Spectrum ASIC 带来了创新功能,如 RoCE (融合以太网上的 RDMA )和自适应路由,所有这些功能都具有最高的网络规模。应该注意的是,许多应用程序(如元宇宙和 AR / VR )需要支持 PTP 的数据中心。这将为云用例中的 RAN 铺平道路。一些网络规模的公司已经在其数据中心支持 PTP 。

具有 NVIDIA A100 Tensor Core GPUNVIDIA BlueField DPUNVIDIA A100X converged accelerator 支持完全内联 5G RAN 卸载。这为从 4T4R 到大规模 MIMO 32T32R 和 64T64R 的一系列配置提供了以每瓦单元密度和每瓦 MHz 层数衡量的市场领先性能。

NVIDIA 正在与各种生态系统合作伙伴合作,以确保其他 O-RAN 软件组件(如 SMO (服务管理和编排)、 RIC ( RAN 智能控制器)、 xApps 和 rApps )针对 NVIDIA Aerial SDK 进行优化,并为云部署中的 RAN 做好准备。这些组件仍处于早期开发阶段,但将是关键的区别,因为它们使用人工智能实现 RAN 自动化和可编程性。虽然云计算中的 RAN 需要一段时间才能成熟,但我们相信 NVIDIA 将在这一创新的前沿,以 NVIDIA GPU 加速平台为基础。

总结

云计算中的 RAN 是未来。这是无线市场的自然演变和下一步。使用云原生技术构建的 vRAN 是必要的第一步。要实现 5G RAN 的云经济,并推动 5G 与边缘 AI 应用的共同创新,需要在云中拥抱 RAN 。 NVIDIA Aerial SDK 提供了可扩展的云原生软件架构,作为云中 RAN 的基础技术。

最后,需要注意的是 RAN 转换刚刚开始。使用人工智能优化复杂的信号处理算法将在未来几年带来一系列全新的创新。 GPU 加速平台是您的投资经得起未来考验的最佳方法。如果您想与我们合作,在云解决方案中构建创新的 RAN ,请联系我们。有关详细信息,请参见 NVIDIA AI-on-5G Platform

免费注册GTC 2023 , 3 月 20 日至 23 日加入我们的 人工智能驱动的无线会话 和 AI 驱动的边缘对话浏览所有通信对话了解更多。

 

Tags