数据中心/云端/边缘

使用最新版本的 NVIDIA NetQ 自动化网络监控并减少停机时间

 

NVIDIA NetQ 是一种高度可扩展的现代网络操作工具,为 NVIDIA Spectrum Ethernet 平台提供可操作的可见性。它将高级遥测技术与用户界面相结合,使网络工作流程更易于故障排除和自动化,同时减少维护和停机时间。

我们最近发布了 NetQ 4.2.0 ,其中包括:

  • 简化的事件管理
  • 增强的流量遥测分析
  • 新 RoCE 验证
  • 新增 DPU 监控

有关新功能和增强功能的更多信息,请参阅 NetQ 4.2.0 用户指南

简化的事件管理

通过 NetQ 4.2 ,我们简化了通过接口传递网络事件的方式。事件的严重性各不相同。一些事件是网络警报,可能需要进一步调查,而其他事件是信息性通知,可能不需要干预。在此版本之前, NetQ 将报警和信息事件显示为两个单独的卡。 NetQ 4.2 版本将两个卡合并为一个卡,扩展后,该卡将显示一个仪表板,以帮助您快速可视化所有网络事件。

A screenshot of a timeline and device view of error and informational events with NetQ
图 1 :。 NetQ 事件仪表板

仪表板显示事件的时间线,以及导致大多数事件的开关。您可以按类型筛选事件,包括接口、网络服务、系统和阈值交叉事件。

承认事件有助于你关注需要你关注的活动事件。从仪表板中,还可以创建规则以抑制事件。此功能还可帮助您关注活动事件,从而使已知问题或错误警报的显示方式与错误显示方式不同。

增强的流量遥测分析

NetQ 4.1.0 为 Cumulus Linux 5 引入了 结构范围内的网络延迟和缓冲区占用分析 。 x 数据中心结构。现在, NetQ 4.2 支持混合结构(使用 Cumulus Linux 5 )中的部分路径流遥测分析。 x 交换机与其他交换机(包括非 Cumulus Linux 5.x 和第三方交换机)结合使用。 Cumulus Linux 5 。路径中的 x 设备显示流统计信息,例如延迟和缓冲区占用率。不受支持的设备在流量分析中表示为带红色 X 的黑条,并且设备不显示流量统计信息。

A screenshot of the NetQ flow telemetry analysis results view with unsupported device in the path.
图 2 :。 NetQ 流量遥测分析结果

此外, NetQ 4.2 流量遥测分析显示了所分析流量的上下文“刚刚发生的事情”( WJH )事件和下降。带有 WJH 事件的交换机在流分析图中表示为红色条纹条。将鼠标悬停在带有红色条的设备上,会显示 WJH 事件摘要。

A screenshot of the NetQ flow telemetry analysis showing devices with What Just Happened (WJH) drops and events
图 3 :。利用 WJH 数据进行 NetQ 流量遥测分析

新 RoCE 验证

通过聚合以太网使用 RDMA ( RoCE ),您可以通过以太网使用远程直接内存访问( RDMA )而不是使用主机 CPU 来写入计算或存储元素。 NetQ 4.0.0 引入了 RoCE 配置和计数器,包括设置各种 RoCE 阈值交叉警报( TCA )的能力。

使用 NetQ 4.2.0 , RoCE 验证检查:

  • 交换机间有损或无损模式配置的一致性
  • DSCP 、服务池、端口组和流量类设置的一致性
  • ECN 阈值设置的一致性
  • 无损模式 PFC 配置的一致性
  • 增强型变速箱选择设置的一致性

您可以安排 RoCE 验证定期或按需运行。

新增 DPU 监控

NVIDIA BlueField 数据处理器 ( DPU )通过卸载、加速和隔离广泛的高级网络、存储和安全服务,为任何工作负载提供安全、加速的基础架构。

NetQ 帮助您监控网络上的 DPU 库存。您可以监视 DPU 操作系统、 ASIC 、 CPU 型号、磁盘和内存信息,以帮助管理升级、法规遵从性和其他规划任务。 使用 NetQ ,您可以查看和监视键 DPU 属性,包括已安装的软件包以及 CPU 、磁盘和内存利用率。

A screenshot of the NetQ graphical user interface DPU card showing CPU, memory, and disk utilization.
图 4 :。 NetQ- DPU 利用率详细信息

在本文中,您已经看到了 NetQ 4.2.0 提供的一些新功能的概述。有关更多信息,请参阅 NetQ 4.2.0 用户指南 ,并使用 NVIDIA Air 浏览 NetQ 。

 

标签