Data Center / Cloud / Edge

NVIDIA BlueField-3 DPU でアプリケーションの次の波を強化

Reading Time: 3 minutes

ChatGPT、Stable Diffusion、DALL-E、そして同様のアプリケーションは、世界を生成 AI に目覚めさせました。ChatGPT は史上最も急速に成長しているアプリケーションです。その使い易さと素晴らしい機能は、わずか数か月で 1 億人以上のユーザーを魅了しました。

生成 AI は、企業が自社の製品やビジネス モデルを再構築しなければならないという危機感を生み出しています。NVIDIA CEO のジェンスン フアンが、GTC 2023 の基調講演で述べたように、iPhone が登場した時と同様の転換期が AI に到来したのです。そして、NVIDIA のアクセラレーテッド コンピューティングは、通常のコンピューターの能力を超える規模で問題を解決することで、世界の企業が AI を活用する手助けをしています。

NVIDIA BlueField DPU がアクセラレーテッド コンピューティングを強化

NVIDIA アクセラレーテッド コンピューティング テクノロジ スタックは、あらゆる産業が AI の力を活用することを可能にし、次世代のアプリケーションを実行するために必要なレベルの性能、拡張性、効率性を提供します。

アクセラレーテッド コンピューティングは、主に 3 つの基本要素で動作します。

  • 直列処理やハイパースレッド アプリケーションの実行に使用される CPU。
  • 並列処理に優れ、最新のワークロードの高速化に最適化された GPU。
  • インフラ コンピューティング タスクに最適な DPU: データ センターのネットワーキング、ストレージ、セキュリティ、管理性のワークロードをオフロード、高速化、分離するために使用される。

最新のソフトウェアデファインドなデータ センターでは、仮想化、ネットワーク、ストレージ、およびセキュリティを実行する OS によって、データ センターの CPU コアと関連電力の半分近くを消費する場合があります。データ センターは、収益を生み出すワークロードのために 、電力を回収、CPU を解放し、あらゆるワークロードを高速化しなければなりません。

NVIDIA BlueField データ プロセッシング ユニット (DPU) は、データ センターの OS とインフラストラクチャ ソフトウェアをオフロードし、高速化します。

NVIDIA は、データ センター規模で NVIDIA Omniverse アプリケーションを作成および運用するための第 3 世代の NVIDIA OVX システムを含む、データセンター コンピューティング システム全体に BlueField-3 を統合しています。詳細については、Omniverse at Scale: NVIDIA Announces Third-Generation OVX Computing Systems to Power Industrial Metaverse Applications (大規模な Omniverse: NVIDIA、産業用メタバース アプリケーションを強化する第 3 世代 OVX コンピューティングシステムを発表) をご覧ください。

DPU を使用する主要企業

Oracle Cloud Infrastructure (OCI) は最近、GTC 2023 での発表に続き、NVIDIA BlueField-3 DPU をネットワーク スタックに統合する計画を発表しました。この計画は、ネットワーキングとセキュリティのタスクを CPU から DPU にオフロードすることで、データ センターのパフォーマンスを最適化し、より高速で効率的な処理を実現することを目指しています。

OCI は、BlueField-3 DPU のパワーを活用することで、インフラを強化し、顧客にシームレスなクラウド体験を提供する体制を整えています。詳細については、Oracle Cloud Infrastructure が NVIDIA BlueField データ センターアクセラレーション プラットフォームを採用をご覧ください。

さらに、Check Point、Cisco、DDN、Dell EMC、Juniper、Palo Alto Networks、Red Hat、VMWare など 20 社以上のエコシステム パートナーが、BlueField のデータ センター アクセラレーション技術を利用して、自社のソフトウェア プラットフォームをより効率的に稼働させています。

NVIDIA BlueField-3 プラットフォームの概要

220 億トランジスタを搭載した NVIDIA BlueField-3 は、第 3 世代の NVIDIA DPU です。これはシステムオンチップ (SoC) デバイスであり、最大 400Gbps のイーサネットと InfiniBand 接続を実現します。最大 4 つの異なる MAC アドレスをサポートする BlueField-3 は、400Gbps のシングル ポート (PAM4 112 の 4 レーン) から 25、50、100 Gbps の 4 ポートまで、様々なポート構成で提供することができます。

BlueField-3 は、前世代と比較してネットワーク帯域幅が 2 倍、コンピューティング性能が 4 倍、メモリ帯域幅がほぼ 5 倍となっており、NVIDIA DOCA ソフトウェア フレームワークによる完全な下位互換性を実現しています。

これらの重要な進歩により、BlueField-3 は TCO を削減し、データ センターで高いエネルギー効率を実現しながら、ワークロードを最大 8 倍高速に実行することができます。例えば、BlueField-3 はHPC/AI MPI コレクティブ処理を CPU からオフロードし、20% 近い高速化を実現しており、これは大規模スーパーコンピューターでは 1,800 万ドルのコスト削減に相当します。詳細については、グリーン列車に乗ろう: NVIDIA BlueField DPU がデータセンターの効率化を推進をご覧ください。

図 1. NVIDIA BlueField-3 DPU は、NVIDIA BlueField-2 DPU と比較して4 倍のメモリ帯域幅と計算能力を発揮しました。

3 つの主要ブロックで構成されている BlueField-3 DPU:

  • ネットワーキング: 最新世代の NVIDIA ConnectX-7 SmartNIC は、ネットワーキングとセキュリティのハードウェア アクセラレータを統合しています。
  • プログラマブル コンピューティング: 制御プレーン アプリケーション向けに最適化された、完全にコヒーレントな低遅延メッシュ インターコネクトを備えた 16 個の ARM A78 v8.2の強力なクラスター。データ プレーンのプログラマビリティは、アクセラレーテッド パイプラインと新しいプログラマブル データ パス アクセラレータ (DPA) によって実現されます。DPA は、16 個のハイパースレッド コアで構成される I/O およびパケット プロセッサで、デバイス エミュレーション、輻輳制御、カスタム プロトコルなど、IO 集約型で低コンピューティングのタスク向けに設計されています。
  • メモリ:  デュアル 64 ビット DDR5-5600 メモリ インターフェイス (帯域幅 80 GB) および統合 32 レーン PCIe Gen 5.0 スイッチ。PCIe インターフェイスは、GPU または直接接続された SSD デバイスを管理するために、サーバーホスト型 (エンドポイント) またはセルフホスト型 (ルート コンプレックス) として分岐して使用することができます。

「サーバーの前のサーバー」として機能する BlueField-3 は、ASPEED AST2600 ベースボード管理コントローラー (BMC) を統合した唯一の DPU プラットフォームです。BlueField BMC は専用プロセッサで、DPU ボードの物理的な状態を監視し、システム管理者が独立した接続を通じてプラットフォームを管理できるようにして、システムの安全性、信頼性、可用性、保守性が向上します。

DPU BMC は、ファームウェアの安全性を確保するために、独自に外部の信頼ルート (root-of-trust) を持つ信頼されたエンティティです。標準インターフェイスと Redfish プロトコルを使用し、分離された帯域外の管理ネットワーク上で BlueField DPU のプロビジョニングと管理を行い、DPU のライフサイクル全体を管理します。

BMC の機能は以下の通りです:

  • BlueField DPU へのコンソール インターフェイス アクセス
  • BlueField UEFI 構成の設定
  • BlueField DPU とそのリソースのモニタリング
  • BlueField DPU ファームウェアのアップデートとリカバリ
  • リセット制御 (BlueField OS が停止している場合でも可能)

BlueField-3 の包括的なポートフォリオ

NVIDIA は、様々な業界やユース ケースに対する独特のコンピューティング、メモリ、パフォーマンスのニーズを満たすように設計された幅広い BlueField-3 プラットフォームを提供しています。これにより、顧客は高度な機能と最先端の性能を享受しながら、特定の要件に合った適切な BlueField-3 製品を選択することができます。

図 2. NVIDIA BlueField-3 DPU の主要プラットフォームとターゲット市場

ターゲット市場と主要プラットフォーム

BlueField-3 DPU は、いくつかの主要プラットフォームとターゲット市場で利用されています。

ハイパースケール HPC / AI

HPC  は最大の性能と巨大な規模を重視しており、HPC と AI のワークロードは、初めて 400 Gbps (NDR InfiniBand および 400 GbE) のネットワーク速度を採用しました。BlueField は、Arm コアを活用してメッセージ パッシング インターフェイス (MPI) ライブラリの要素をシステム ホスト CPU からオフロードし、ノンブロッキング コレクティブ処理を実装することで、NVIDIA のネットワーク内コンピューティング機能を拡張します。これにより、システム ホスト CPU は、ピーク オーバーラップで演算を実行することができます。

B3240: 最も困難なハイパースケール HPC/AI のニーズに対応する性能とネットワーク機能を備えています。この BlueField-3 プラットフォームは、NVIDIA DGX H100 のようなシステムで、科学研究や生成 AI のワークロードに対応するために使用されます。デュアル 400Gbps NDR 接続、32GB DDR5 メモリ サブシステム、2.3GHz の Arm コア速度を採用しています。

B3140H: Half-Height Half-Length (HHHL) フォーム ファクターを備え、ほとんどのエンタープライズ サーバーに対応します。このデバイスは、400 Gbps のシングルポートと 16 GB DDR5 メモリを提供し、低消費電力で動作します。これにより、限られたスペースや電力の制約の中で拡張性の高いパフォーマンスを必要とする HPC/AI 環境に最適です。

クラウド コンピューティング

クラウド業界の急速な成長により、クラウド プロバイダーは常に革新的なサービスを提供し、顧客の需要に応える必要があります。最新のクラウド プラットフォームは、ハイパーバイザーベースの仮想化を使用して、コンピューティング レベルとデータ センター レベルの両方で、テナントに割り当てられる仮想インスタンス数を最大化します。最大 4,096 の仮想機能をサポートする BlueField-3 により、クラウド プロバイダーは、前世代と比較して 4 – 8 倍の仮想インスタンスをクラウド コンピューティング プラットフォームにホストすることができます。

B3220: デュアル 200 Gbps サポート、32GB DDR5 メモリ サブシステム、2.3GHz の Arm コア速度を提供する B3220 は、最も困難なクラウドのニーズに応えるパフォーマンスとネットワーク機能を備えています。ハイパースケーラーである Oracle Cloud Infrastructure (OCI) が BlueField-3 をネットワーク スタックに追加したのはこのためで、最先端の持続可能なクラウド インフラを極めて高いパフォーマンスで提供することを目的としています。また、B3220 プラットフォームは NVIDIA OVX 3.0 システムにも対応し、クラウドにおける産業用メタバース アプリケーションの性能を高め、ゼロトラスト セキュリティ、無限の拡張性を実現します。

B3210: 100 Gbps の B3210 は、先進的なエンタープライズ データ センターの需要に応えるのに最適です。B3210 は、エンタープライズ ワークロード プラットフォーム VMware vSphere を実行するための対象 DPU であり、数千もの企業のパフォーマンス、効率、セキュリティを向上させています。

ストレージ

B3220SH: B3220SH セルフホスト プラットフォームは、NVMe-oF または NVMe/TCP または保存データ アクセラレータを統合した NVMe ストレージ システム向けに最適化されています。B3220SH は、32レーンの PCIe Gen 5.0 インターフェイスを使用して最大 16 台の SSD をホストすることができます。

業界をリードするネットワーク パフォーマンス

BlueField-3 は、以前のモデルと比較してパフォーマンスが大幅に向上しており、高性能なネットワーキングを必要とするデータ集約型の AI ワークロードにとって理想的なソリューションです。図 3 は、BlueField-3 のネットワーク性能の高さを示すベンチマーク結果です。

図 3. NVIDIA BlueField-3 と BlueField-2 DPU を比較したテスト結果

NVIDIA BlueField-3 DPU でアプリケーションを強化

クラウドが企業 IT を支配している昨今、生成 AI、データ サイエンス、メタバース アプリケーションといった現代のワークロードが急成長しています。 AI に対する急増する需要に対応するため、クラウド ビルダーは GPU と DPU を中心とした NVIDIA アクセラレーテッド コンピューティングに注目しています。

NVIDIA DOCA ソフトウェアを搭載した NVIDIA BlueField-3 DPU は、従来のコンピューティング環境を効率的で高性能、安全かつ持続可能なデータ センターに変え、次の波のアプリケーションの提供を可能にします。詳細については、BlueField-3 のデータシートネットワーキング関連情報をご覧ください。

関連情報

翻訳に関する免責事項

この記事は、「Power the Next Wave of Applications with NVIDIA BlueField-3 DPUs」の抄訳で、お客様の利便性のために機械翻訳によって翻訳されたものです。NVIDIA では、翻訳の正確さを期すために注意を払っておりますが、翻訳の正確性については保証いたしません。翻訳された記事の内容の正確性に関して疑問が生じた場合は、原典である英語の記事を参照してください。

Tags