Data Center / Cloud / Edge

データセンター ネットワークの最適化

Reading Time: < 1 minute

データ センターは、ネットワーク テクノロジーまたは NetDevOps による運用効率化の 2 つの方法で主要なネットワーク アーキテクチャを更新することで、最適化することができます。この記事では、ネットワークを最適化するためにネットワーク アーキテクチャに適用できる技術を特定し、評価します。

データ センター改善のために検討すべき 5 つのアップデートを取り上げます。

  • レイヤー 2 VLAN を VXLAN に置き換える。
  • アドレス解決プロトコル (ARP) 抑制を使用し、ブロードキャスト伝搬を減らす。
  • マルチシャーシ リンク アグリゲーション グループ (MLAG) を EVPN マルチホーミングに置き換える。
  • ECMP (Equal Cost Multi-Path) ルーティングと UCMP でトラフィック バランスを処理する。
  • アダプティブ ルーチングでトラフィックの偏波に対応。

VLAN を VXLAN に置き換える

VXLAN は、カプセル化を利用して、レイヤー 2 のオーバーレイ VLAN をレイヤー 3 のネットワークにまたがるようにするオーバーレイ技術です。レイヤー 2 ネットワークには、固有の欠点があります。

  • スパニング ツリー プロトコル (STP) に依存しているため、冗長性と複数パスの機能はスパニング ツリーの機能によって制限されます。
  • 1 つのサブネット内でのみ動作可能で、冗長性は MLAG により通常 2 台までしか確保できません。
  • パスレベルの冗長化には、ポートの標準冗長化技術である LACP (Link Aggregation Control Protocol) が必要です。

VXLAN は、これらの欠点を克服し、ネットワーク オペレーターがレイヤー 3 ルーティング ファブリック上で最適化できるようにします。レイヤー 2 オーバーレイも実現できますが、コントロール プレーンとして EVPN に依存するため、コントロール プレーンの収束にスパニング ツリーは必要ありません。

EVPN では、非効率なブロードキャストと学習に頼らず、BGP アドレス ファミリを介して MAC 情報を交換します。さらに、VXLAN は 24 ビットの ID を使用し、最大 1600 万の仮想ネットワークを定義できるのに対し、VLAN は 12 ビット ID のみで、4094 の仮想ネットワークに限定されます。

ARP 抑制を使用し、ブロードキャスト伝搬を減らす

VXLAN を使用するデータ センターでのブロードキャスト トラフィックは、ARP 抑制でさらに最適化できます。ARP 抑制は、EVPN を使用して、ToR の仮想トンネル エンド ポイント (VTEP) からクライアントへの ARP 要求に対する応答を直接プロキシすることで、トラフィックを削減するのに役立ちます。

  • ARP 抑制を行わない場合、すべての ARP リクエストは VXLAN ファブリック全体にブロードキャストされ、ネットワーク用の VNI を持つすべての VTEP に送信されます。
  • ARP 抑制を有効にすると、EVPN で学習した MAC アドレスは ARP コントロール プレーンに引き渡されます。

VTEP として動作するリーフ スイッチは、プロキシ ARP リプライにより ARP リクエストに直接応答を返します。

IP-MAC マッピングは、EVPN タイプ 2 メッセージを使用して VXLAN コントロール プレーンですでに通信されているため、ARP 抑制を実装すると、オーバーレイ コントロール プレーンの高速解決のための最適化が可能になります。また、ARP 抑制により、VXLAN インフラストラクチャのすべての VTEP に ARP 要求をフラッディングする必要がなくなるため、ファブリック内のブロードキャスト トラフィックの量も削減されます。

MLAG を EVPN マルチホーミングに置き換える

VXLAN 環境では、冗長なホスト接続のために MLAG が必要な場合があります。EVPN マルチホーミングは、1 レベルのデバイス冗長性を超えて拡張できない独自の MLAG ソリューションから移行するチャンスです。

先に述べたように、VXLAN は MLAG で必要とされるリーフとスパインの背中合わせの接続を取り除くのにのに役立ちます。EVPN マルチホーミングはさらに一歩進んで、サーバーからリーフへの接続に MLAG が不要になります。

マルチホーミングは、EVPN メッセージを用いてホストの接続性を通信し、ホストの接続情報を用いてサーバーとの L2 隣接を動的に構築します。MLAG では LAG ID が必要ですが、マルチホーミングではイーサネット セグメント ID を使用します。インターフェイスは、同じエンドホストへの論理接続のように動作するセグメントにマッピングされます。

さらに、マルチホーミングに移行することで、スイッチにプロトコル標準の冗長性を使用するため、ネットワーク ベンダーの相互運用性が向上します。マルチホーミングはオープン スタンダードのプロトコルである BGP を使用しているため、RFC 仕様でマルチホーミングを実装しているベンダーであれば、イーサネット セグメントに参加することが可能です。

ECMP と UCMP によるトラフィック バランスの処理

ECMP は、ほとんどのレイヤー 3 ルーティング プロトコルの標準機能で、利用可能なすべてのネクストホップ アップリンクで等価コストとなる経路をバランスさせるものです。スパニング ツリーなどのレイヤー 2 制御プレーン技術では、LACP などの外部技術に依存することで等価コスト バランスを実現しています。

ECMP はレイヤー 3 ルーティングのネイティブ機能であり、ネットワーク機器の効率化を実現します。

ECMP が非効率的な転送につながる場合があります。特に、ポイントツーポイントの L3 リンクがホストに至るまでファブリックのあらゆる場所で使用されるフル レイヤー 3 ソリューションの場合です。この場合、リンク数以外の指標でトラフィックのバランスを取りたい場合があります。UCMP は、BGP タグを使用してホップ間のトラフィック配分を作成し、アプリケーションの配分に合わせることができるため、このような場合に有効です。

アダプティブ ルーティングによるトラフィックの偏りへの対応

アダプティブ ルーティングは、既存の InfiniBand 技術をイーサネット スイッチングで採用したものです。アダプティブ ルーティングは、リンク帯域、リンク利用率、スイッチ バッファー、ECN/PFC を監視し、特定のパスのトラフィックがいつ混雑し、より混雑の少ないパスへ動的に再ルーティングすることが有効であるかを理解します。

これらのメトリックのしきい値を満たすことで、スイッチはトラフィックをある ECMP グループの egress インターフェイスから別の egress インターフェイスにリダイレクトすることができます。これにより、偏りによる非効率なトラフィック フローが発生することなく、スイッチ上のすべてのリンクを等しく活用することができます。

アダプティブ ルーティングの目標は、ネットワーク管理者の手から手動によるチューニングの介入を排除し、インフラに集約的なフロー バランスの最適化を処理させることです。

結論

この投稿では、プロトコル スタックとデータ プレーンに注目し、ネットワーク インフラを最適化するのに役立つ、データ センター ネットワークで利用可能ないくつかの概念について説明しました。これらの最適化はより良いネットワーク仮想化を提供し、インフラストラクチャ上の不要な制御トラフィックを減らし、既存のレイヤー 1 リンク間でトラフィックのバランスを取り、利用可能な全ての帯域幅を完全に使用するのに役立ちます。

詳しくは、以下の資料をご覧ください。

翻訳に関する免責事項

この記事は、「Optimizing Your Data Center Network」の抄訳で、お客様の利便性のために機械翻訳によって翻訳されたものです。NVIDIA では、翻訳の正確さを期すために注意払っておりますが、翻訳の正確性については保証いたしません。翻訳された記事の内容の正確性に関して疑問が生じた場合は、原典である英語の記事を参照してください。

Tags