ChatGPT を動かすものとは? - ビデオのご紹介 -

Reading Time: < 1 minute

数年前、創業者/ CEO のジェンスンフアン (Jensen Huang) は、世界初の NVIDIA DGX AI システムを OpenAI に直接提供しました。そして今、OpenAI の ChatGPT は世界を席巻しています。ChatGPT によって人工知能 (AI) のメリットや機能が浮き彫りとなり、規模に関わらずあらゆる業界や企業において、 AI がどのように活用できるかが明らかになっています。

さて、ChatGPT をホストしてサポートするのに必要なテクノロジやインフラストラクチャについて、よく考えたことはあるでしょうか?

このビデオでは、Microsoft Azure の CTO であるマークルシノビッチ (Mark Russinovich) 氏が、 AI 専用スーパーコンピューターを支えるインフラストラクチャの背後にあるテクノロジスタックについて説明しています。このインフラストラクチャは、ChatGPT やその他の大規模言語モデル (LLM) をどのような規模でもホストできるように、NVIDIA と Microsoft Azure が OpenAI と協力して開発したものです。

主なポイント

データの並列処理アプローチにより、NVIDIA H100 Tensor コア GPU を使用した推論のパフォーマンスが 30 倍、モデルトレーニングのパフォーマンスが 4 倍向上しました。
より高度な LLM の処理要求を満たすために、VM は NVIDIA Quantum-2 InfiniBand ネットワーキングを使用して拡張されました。
大規模なトレーニングでは、サーバーの障害やネットワークのフラップは避けられません。マイクロソフトの Project Forge は、ジョブを迅速に再開して、グローバルで高い稼働率を維持するために、透過的なチェックポイント機能を導入しました。
低ランク適応 (LoRA) のファインチューニングにより、10 億パラメーターモデルを大規模に処理する際の GPU 使用量とチェックポイントのサイズが小さくなります。
Wayve をはじめとする業界の先駆者は、計算集約型のワークロードに AI スーパーコンピューターインフラストラクチャを活用しています。
今後、 NVIDIA H100 GPU を活用したコンフィデンシャルコンピューティングが Azure 上でサポートされます。これにより、機密データの安全性を確保し、使用中の有用な AI モデルを保護、AI の安全なマルチパーティコラボレーションのユースケースが実現します。

動画 1. ChatGPT を動かすものとは? マイクロソフト AI スーパーコンピューターのしくみ | マークルシノビッチ氏出演

まとめ

数千億のパラメーターを使用して AI モデルをトレーニングする場合に鍵となるのが、効率性の高いデータセンターインフラストラクチャです。これにより、スループットが向上しサーバー障害が大幅に削減できるだけでなく、マルチ GPU クラスターを活用したコンピューティング集約型のワークロードが実現します。

データセンターインフラストラクチャを最適化して大規模なモデルを確実に展開する方法について、詳しくは以下の資料を参照してください。

NVIDIA AI プラットフォーム: コンピューティングやソフトウェアから AI モデルやサービスに至るまで、フルスタックのイノベーションにより AI 開発を楽に実現します。
最新のデータセンター: NVIDIA AI をすばやく導入するために IT リーダーがデータセンターをどのように拡張、管理しているか、余すところなくご覧いただけます。
H100 Tensor コア GPU: テクノロジの革新が集結し、LLM を前世代と比べて 30 倍高速化します。
NVIDIA NeMo: 企業のお客様が LLM を構築、カスタマイズ、展開して生成 AI アプリケーションを強化できるようにします。
NVIDIA Quantum InfiniBand プラットフォーム

ChatGPT を動かすものとは? – ビデオのご紹介 –

主なポイント

まとめ

関連資料

Tags

About the Authors

ChatGPT を動かすものとは? – ビデオのご紹介 –

主なポイント

まとめ

関連資料

Tags

About the Authors

関連記事

本番環境への AI モデルのデプロイを効率化する NVIDIA NIM

NVIDIA GB200 NVL72 は兆単位パラメーターの LLM トレーニングとリアルタイム推論を実現

NVIDIA、「Isaac Sim で仮想空間から現実世界へ」をテーマに、2023 国際ロボット展に出展

NVIDIA Jetson で エッジに AI 学習をさせる

Triton Inference Server 2022 年 12 月 - 2023 年 2 月のリリース概要

NVIDIA Jetson でエッジに AI 学習をさせる