数据中心/云端/边缘

利用 5G vRAN 的 AI 云基础设施释放新机遇

 

根据最近的一份 GSMA 对于移动经济 的报告,手机行业每年在无线接入网络( RAN )上花费超过 500 亿美元。专用和过度配置的硬件主要用于为峰值需求提供容量。因此,大多数 RAN 站点都 平均利用率低于 25%

多年来,随着技术从 2G 发展到 4G ,这已成为业界的现实。但随着致密化的推进,再加上 mmWave 的使用,到 2027 年将接近 doubling of the number of cell sites ,超过 1700 万, 5G 的情况将更加明显。这意味着, RAN 资本支出在整个网络总拥有成本( TCO )中所占的份额将增至 65% in 5G ,而 4G 的这一比例为 45-50% 。

一种改变游戏规则的新方法将未充分利用转化为机会:利用 AI 使用的相同云和数据中心基础设施,动态加载 5G 虚拟 RAN ( vRAN )共享。这种方法为云提供商创造了新的机会,并有助于降低运营成本。

图 1 显示了 NVIDIA 如何使用 NVIDIA -A100X 聚合卡、 Spectrum SN3750SX 交换机、 NVIDIA Aerial SDK 和容器 DU 启用 CloudRAN 解决方案。

Diagram of NVIDIA CloudRAN solution.
图 1. NVIDIA CloudRAN 解决方案,为 5G 和 AI 工作负载提供灵活的映射和动态计算利用率

RAN 利用不足的机会

通过将基带计算资源汇集到云本地环境中, CloudRAN 解决方案显著提高了资产利用率,为电信公司创造了效率收益,为云服务提供商( CSP )创造了收入机会。该解决方案通过动态协调 5G 和 5G RAN 非高峰工作负载之间的资源来实现这一点。

5G RAN 非高峰工作负载的示例包括 AI 工作负载,如驱动器映射、联合学习、离线视频分析、预测维护、工厂数字孪生等。 5G 计算能力映射到 5G 无线电的通信需求变化,而剩余的计算用于 AI 工作负载。对于电信公司来说,这可以将 RAN 运营效率提高 2 倍以上,对运营利润的影响估计为 25% 或以上。

对于顾客服务提供商来说,在其现有数据中心架构中,将 5G vRAN 作为工作负载与人工智能工作负载一起运行是一个重要的机会。举一个具体的例子,美国无线市场包括大约 42 万个手机站点。如果电信运营商对其 50% 的网络(主要是市区)使用集中式 RAN ( C-RAN ),并运行 4 : 1 配置,那么他们将使用 52000 GPU 来运行网络。

在典型的数据中心中,每小时 GPU 的计算费用为 2 美元。使用动态编排结合 5G 和 AI 工作负载的 C-RAN 配置以及 CSP 的 52000 GPU 货币化将带来 5 亿美元的收入机会。在全球范围内,这是一个数十亿美元的机会。

图 2 显示了可以在非高峰期间动态共享 C-RAN GPU 和 5G 工作负载的非高峰 AI 工作负载。

Diagram of AI workloads that can be run during RAN off-peak
图 2.可以与 5G 动态共享 CloudRAN GPU 的非高峰工作负载

举个例子,车内 AI 超级计算机和云中的 GPU 资源相结合,可以对自动驾驶汽车进行离线处理。该系统结合了深度学习算法,使用人工智能和视觉同步定位与映射( VSLAM )组合检测车道、标志和其他地标。

业界认识到将软化 RAN 资源集中在几个集中的枢纽位置的总体趋势。虽然这在分布式 RAN 拓扑上将 RAN TCO 提高了 30% 以上,但并不能解决 RAN 利用不足的问题。为什么?未使用的 RAN 计算资源在非高峰时段被浪费。

NVIDIA CloudRAN :五个构建块

为了实现 CloudRAN 解决方案,当前的 vRAN 需要在以下五个关键重点领域进行发展。

首先,需要具有最佳定时机制的软件定义前线( SD-FH )。其次, RAN 硬件需要从定制、专用和(在许多情况下)非云本地架构发展到基于 COTS 和云本地硬件。第三,软化 5G RAN 需要能够实时编程,并能够在云基础设施上运行。第四, 5G RAN 的生命周期管理( LCM )需要是动态的,并基于开放 API 。

最后,需要一个端到端( E2E )网络和服务协调器,它可以根据网络和基础设施利用率信息动态管理 RAN 和其他非高峰工作负载。 E2E 服务编排通过基于服务模型、策略和上下文动态组合工作流,并使用闭环控制来自动化整个服务和网络,从而执行服务意图。

NVIDIA CloudRAN 为 vRAN 的五个确定的演进需求中的每一个确定并提供了一个支持解决方案,如图 3 所示。

Diagram of the building blocks of NVIDIA CloudRAN solution
图 3. NVIDIA CloudRAN 解决方案的组件
  • SD-FH switchNVIDIA SN3750-SX 是基于 Spectrum-2 ASIC 的新型 200G 以太网交换机。它是专门为 CloudRAN 融合基础设施提供网络结构而构建的,在那里,它与 5G 网络一起运行 AI 培训工作负载。它具有软件定义和硬件加速的 5G 前端传输能力,可根据协调器映射将 5G 流量可用 DU 引导至 RU 。它提供具有 PTP 电信配置文件、 SyncE 和 PPS 输入/输出的 5G 时间同步协议。交换机还支持 NetQ 验证工具集。
  • 通用计算硬件: NVIDIA A100X 融合卡将 NVIDIA A100 Tensor Core GPU 的功能与 NVIDIA [VZX2]的高级网络功能结合在一个单一、独特的平台上。这种融合为 GPU 驱动的 I / O 密集型工作负载提供了无与伦比的性能,例如企业数据中心的分布式 AI 培训和 5G vRAN 处理作为现有数据中心架构中的另一个工作负载。
  • 可编程和云原生 5G 软件: NVIDIA Aerial SDK 在 CloudRAN 解决方案中提供 5G 工作负载。 NVIDIA Aerial 是一个运行在 COTS 服务器上的全云本地虚拟 5G RAN 解决方案。它使用 Kubernetes 并应用 DevOps 原理,在裸机服务器上实现 RAN 作为容器中的微服务的功能。它提供了一个 5G RAN 解决方案,具有内联 L1 GPU 加速功能,用于 5G NR PHY 处理,并支持 gNB 集成 L2 / L3 ( MAC 、 RLC 、 PDCP )的完整堆栈框架,以及可管理性和编排。
  • 开放 API 生命周期管理: 无论多供应商或多技术网络如何, O-RAN 分解的、以软件为中心的方法都可以帮助自动化和协调 RAN 复杂性。最终,服务管理编排( SMO )将为 RAN 自动化提供开放和 Kubernetes 集群 API 。
  • E2E 网络和服务协调器: E2E 编排通过跨所有技术和云域实时整合 E2E 视图,实现动态应用程序和服务。单个窗格支持跨域服务的所有方面的自动化,并管理各种工作负载的生命周期管理、优化和保证。 E2E 协调器还将具有一个与云基础设施管理器交互的接口。

交付 CloudRAN 解决方案

NVIDIA CloudRAN 解决方案通过 SD-FH 、通用数据中心计算、云本地架构、 RAN 域协调器以及 E2E 服务和网络协调器提供了引人注目的价值。

NVIDIA 及其生态系统合作伙伴正在构建基于 Kubernetes 的 SMO 和 E2E 服务协调器,以支持动态工作负载管理。通过电信公司, NVIDIA 正在开发基于 COTS 和云本地 vRAN 软件。通过 CSP , NVIDIA 正在努力优化数据中心硬件,以支持 5G 工作负载。

加入我们的 GTC 2022 会议, Using AI Infrastructure in the Cloud for 5G vRAN 了解更多信息 关于 CloudRAN 解决方案

 

Tags