ディープラーニングソフトウェア

NVIDIA CUDA-X AI は、研究者やソフトウェア開発者が、対話型 AI、レコメンダーシステム、コンピュータービジョン向けの高性能な GPU アクセラレーションアプリケーションを構築するための完全なディープラーニングソフトウェアスタックです。CUDA-X AI ライブラリは、MLPerf などのさまざまな業界ベンチマークにおいて、トレーニングと推論の両方で世界をリードするパフォーマンスを発揮しています。

TensorFlow、PyTorch、 JAX をはじめ、すべてのディープラーニングフレームワークは、シングル GPU でのアクセラレーションに対応しており、マルチ GPU やマルチノードの構成によるスケールアップも可能です。フレームワークの開発者や研究者は、GPU に最適化された CUDA-X AI ライブラリの柔軟性を利用して、新しいフレームワークやモデルアーキテクチャを高速化できます。

CUDA-X をベースとする NVIDIA の統合プログラミングモデルにより、デスクトップやデータセンターでディープラーニングアプリケーションを開発して、データセンター、リソースに制約のある IoT デバイス、自動車プラットフォームに最小限のコード変更で展開できます。

NVIDIA® NGC™ カタログでは、一般的なディープラーニングモデル向けの学習済みモデル、トレーニングスクリプト、最適化されたフレームワークコンテナー、推論エンジンを提供しています。NVIDIA AI Toolkit には、学習済みモデルの転移学習、微調整、最適化、展開のためのライブラリが含まれており、幅広い業界や AI ワークロードに対応しています。

NVIDIA Github には、各種の製品、デモ、サンプル、チュートリアルの 100 を超えるリポジトリがあるため、すぐに始められます。

deep learning training and inference software chart

あらゆるフレームワークとの統合

ディープラーニングフレームワークは、高度なプログラミングインターフェイスからディープニューラルネットワークを設計、トレーニング、検証するためのビルディングブロックを提供します。PyTorch や TensorFlow、JAX などの広く使用されるディープラーニングフレームワークで cuDNN や TensorRT などの GPU アクセラレーションライブラリを利用することにより、GPU で高速化されるハイパフォーマンスなトレーニングや推論を実現できます。

NGC では、最新の GPU に最適化され、CUDA ライブラリおよびドライバーと統合されたコンテナー化されたフレームワークを提供しています。毎月のリリースの一環として検証とテストが実施されており、さまざまなエッジやクラウドプラットフォームで最高のパフォーマンスが得られるようになっています。フレームワークとの統合、リソース、サンプルの詳細を確認して、利用を開始するには、ディープラーニングフレームワークのページをご覧ください。

ディープラーニングトレーニング

CUDA-X AI ライブラリは、あらゆるフレームワークにおけるディープラーニングトレーニングを加速させます。その高性能な最適化により、対話型 AI、自然言語理解、レコメンダーシステム、コンピュータービジョンなどのさまざまなアプリケーションで、GPU による世界トップクラスのパフォーマンスを実現しています。最新の GPU 性能は、ディープラーニングトレーニングパフォーマンスのページでいつでもご確認いただけます。

GPU アクセラレーションフレームワークを使用すると、Tensor コアでの混合精度演算などの最適化により、さまざまな種類のモデルを高速化できるほか、シングル GPU 上のトレーニングジョブを、数千もの GPU から成る DGX SuperPOD にスケーリングするのも簡単です。

MLPerf 0.6 AI ベンチマークにおける NVIDIA の性能

V100 での ResNet-50 v1.5 の計算時間

MXNet | バッチサイズは CNN V100 トレーニング表を参照 | 精度: 混合 | データセット: ImageNet2012 | 収束基準は MLPerf の要件を参照

ディープラーニングが言語理解や対話型 AI といった複雑なタスクに適用されるようになるにつれ、モデルのサイズとそのトレーニングに必要なコンピューティングリソースが爆発的に増大しています。一般的なアプローチでは、汎用的なデータセットで事前にトレーニングされたモデルから開始し、特定の業界、ドメイン、ユースケースに合わせて微調整を行います。NVIDIA AI ツールキットでは、学習済みモデルから開始して転移学習や微調整を行うためのライブラリやツールを提供しているため、独自の AI アプリケーションの性能と精度を最大限に高めることができます。

DALI

Data Loading Library (DALI) は、GPU アクセラレーションを利用したデータ拡張および画像読み込みライブラリです。ディープラーニングフレームワークのデータパイプラインを最適化できます。

詳細を見る

cuDNN

CUDA Deep Neural Network (cuDNN) は、畳み込み、活性化関数、テンソル変換のためのディープラーニングプリミティブなど、ディープニューラルネットワークアプリケーション用のビルディングブロックを備えた高性能ライブラリです。

詳細を見る

NCCL

NVIDIA Collective Communications Library (NCCL) は、all-gather、reduce、broadcast などのルーチンにより、最大 8 基まで拡張可能なマルチ GPU 通信を高速化します。

詳細を見る

NeMo

NVIDIA Neural Modules (NeMo) は、AI アクセラレーションを利用した音声および言語アプリケーションのための最先端のニューラルネットワークを構築できるオープンソースツールキットです。

詳細を見る

TAO ツールキット

TAO ツールキットは、AI のトレーニングを高速化するための Python ベースのツールキットで、学習済みモデルの最適化や転移学習の適用により、高い精度を実現できます。学習済みモデルは、DeepStream SDK や TensorRT を使用することで NVIDIA エッジプラットフォーム上で効率的にプルーニングして展開できるため、高性能 AI システムの構築が可能です。

詳細を見る

DIGITS

NVIDIA Deep Learning GPU Training System (DIGITS) は、データの管理、マルチ GPU システムのコンピュータービジョンネットワークの設計とトレーニング、リアルタイムのパフォーマンス監視が可能なインタラクティブなツールで、展開用に最適なパフォーマンスのモデルを選別できます。

詳細を見る

I Assisted Annotation ツールキット

AI-Assisted Annotation ツールキットを使用すると、クライアント API と学習済みモデルを介して、医療ビューアーを AI 対応にすることができます。

詳細を見る

ディープラーニング推論

CUDA-X AI には、コンピュータービジョン、対話型 AI、レコメンダーシステム などのアプリケーションを運用環境 で実行する際に、レイテンシを最小限に抑え、スループットを最大限に高める ことができる高性能ディープラーニング推論 SDK が含まれています。NVIDIA の推論 SDK で開発されたアプリケーションは、CPU のみのプラットフォームと比較して、GPU による最大 40 倍の推論性能を実現できます。

CUDA 統合プラットフォームをベースにして構築された NVIDIA の CUDA-X 推論ソリューションは、デスクトップ上で任意のフレームワークを用いてモデルを開発し、最適化を適用して、推論用にデータセンターおよびエッジに簡単に展開できます。

対話型 AI やレコメンダーシステムのアプリケーションパイプラインでは、顧客からの問い合わせ 1 件あたり 20 ～ 30 個のモデルを実行し、それぞれのモデルで数百万のパラメータを処理します。アプリケーションの応答性が高いと感じられるようにするには、このパイプラインを 300 ミリ秒未満で完了する必要があり、各モデルに非常に厳しいレイテンシ要件が課されます。高性能の最適化と 低精度の推論 (FP16 や INT8) を用いると、GPU では他のプラットフォームよりも 大幅に高いパフォーマンスを得ることができます。

最新の GPU 性能は、ディープラーニング推論パフォーマンスのページでいつでもご確認いただけます。

TensorRT を用いた CNN での推論画像分類

ResNet-50 v1.5 のスループット

ResNet-50 v1.5 のレイテンシ

TensorRT

NVIDIA TensorRT は、高性能ディープラーニング推論用 SDK です。ディープラーニング推論向けのオプティマイザーとランタイムが含まれており、ディープラーニング推論アプリケーションにおける低レイテンシ、高スループットを実現します。

詳細を見る

DeepStream SDK

DeepStream SDK は、マルチセンサー処理、AI ベースの映像および画像理解のための包括的なストリーミング分析ツールキットです。

詳細を見る

NVIDIA Triton Inference Server

NVIDIA Triton Inference Server はオープンソースの推論ソフトウェアで、GPU 使用率を最大化する DL モデルを提供します。Kubernetes と統合されており、オーケストレーション、メトリクス収集、自動スケーリングが可能です。

詳細を見る

NVIDIA Riva

NVIDIA Riva は、視覚、音声、その他のセンサーを融合した AI アプリケーションの構築と展開のための SDK です。ジェスチャーや視線などの視覚的な手がかりをコンテキスト内の音声と共に使用できる GPU アクセラレーション AI システムを構築、トレーニング、展開するための完全なワークフローを提供します。

詳細を見る

NGC カタログの学習済みモデルと DL ソフトウェア

The NVIDIA® NGC™ カタログは、ィープラーニングと機械学習のための GPU 最適化ソフトウェアのハブです。AI ソフトウェアは毎月更新され、ワークステーション、オンプレミスサーバー、エッジ、クラウド上の GPU 搭載システムに簡単に展開できるコンテナーを通じて提供されます。学習済みモデルとモデルスクリプトも揃っており、開発者は自らのデータセットで独自のモデルをすばやく構築できます。さらに、業界固有のニーズに対応する AI ソリューションを構築するための SDK と、ソフトウェアの展開を容易にする Helm レジストリも用意されており、計算時間を短縮できます。

NGC™ カタログの目的は、AI ソフトウェアへのアクセスを容易にして、データサイエンティストや開発者が AI ソリューションの構築に集中できるようにすることです。

ディープラーニングソフトウェアコンテナー

TensorFlow、PyTorch、TensorRT などの DL ソフトウェアコンテナーは、パフォーマンス向上のために効率的なライブラリで常時更新されており、ソフトウェアは毎月リリースされます。これにより、ユーザーは最新バージョンのコンテナーをプルするだけで、同じハードウェアでさらに高速なトレーニング性能と推論性能を得られます。ソフトウェアはシングルおよびマルチ GPU システム、ワークステーション、サーバー、クラウドインスタンスでテストされており、あらゆるコンピューティングプラットフォームで一貫したエクスペリエンスを提供します。

詳細を見る

学習済みモデル

NVIDIA® NGC™ カタログでは、音声読み上げ、自動音声認識、自然言語処理など、一般的な AI アプリケーション向けの学習済みモデルを提供しています。NVIDIA® NGC™ カタログのモデルをユーザー独自のデータセットで再トレーニングすれば、ゼロから始めるよりも格段に速くモデルを構築でき、貴重な時間を節約できます。さらに、学習済みモデルは精度が高く、MLPerf ベンチマークでも優れたスコアを獲得しています。カスタムのデータセットで微調整することにより、比類ない性能と精度を実現することが可能です

詳細を見る

スクリプト

NVIDIA® NGC™ カタログでは、ディープラーニングモデル作成の手順とスクリプトのほか、結果を比較できるように性能と精度のサンプル指標も提供しています。これらのスクリプトは、無駄のない高精度のモデルを構築するためのベストプラクティスを活用しつつ、高い柔軟性も備えているため、ユースケースに合わせてモデルを自在にカスタマイズできます。

詳細を見る

開発者/DevOps 向けツール

NVIDIA の開発者向けツールはデスクトップやエッジ環境で動作し、ディープラーニング、機械学習、HPC アプリケーションにおける複雑な CPU と GPU の利用に関する独自のインサイトを提供します。これにより、開発者はアプリケーションの構築、デバッグ、プロファイリング、パフォーマンスの最適化を効果的に行えます。Kubernetes on NVIDIA GPU を使用すれば、企業はトレーニングや推論の展開環境をマルチ GPU クラスターにシームレスに拡張できます。

NSIGHT Systems

Nsight Systems は、アプリケーションのアルゴリズムを可視化するために設計された、システム全体を対象としたパフォーマンス分析ツールです。最大限の最適化が可能な部分を特定し、CPU や GPU の数や規模に関係なくスケーリングを効率的に調整できます。

DLProf

DLProf (Deep Learning Profiler) は、GPU の使用率、Tensor コアでサポートされている操作、実行中の Tensor コアの使用状況を可視化するプロファイリングツールです。

Kubernetes on NVIDIA GPU

Kubernetes on NVIDIA GPU を利用すると、企業はトレーニングと推論の展開環境をマルチクラウド GPU クラスターにシームレスにスケールアップできます。開発者は、GPU アクセラレーションアプリケーションを依存関係と一緒に 1 つのパッケージにまとめ、Kubernetes で展開し、展開環境を問わず NVIDIA GPU 上で最高のパフォーマンスを実現できます。

NSIGHT Compute

Nsight Compute は、CUDA を使用して直接構築されたディープラーニングアプリケーションのためのインタラクティブなカーネルプロファイラです。GUI またはコマンドラインインターフェイスから、詳細なパフォーマンス指標を確認したり、API のデバッグを行ったりできます。また、Nsight Compute のデータ駆動型のユーザーインターフェイスはカスタマイズ可能で、提供される指標コレクションは、結果の後処理用の分析スクリプトで拡張可能です。

Feature Map Explorer

FME (Feature Map Explorer) を使用すると、低レベルのチャネル視覚化や、特徴マップの完全なテンソルおよび各チャネルスライスに関する詳細な数値情報など、さまざまなビューで 4 次元の画像ベースの特徴マップデータを視覚化できます。

ページトップへ戻る

ディープラーニング ソフトウェア

あらゆるフレームワークとの統合

ディープラーニング トレーニング

MLPerf 0.6 AI ベンチマークにおける NVIDIA の性能

ディープラーニング推論

TensorRT を用いた CNN での推論画像分類

NGC カタログの学習済みモデルと DL ソフトウェア

開発者/DevOps 向けツール

ディープラーニングソフトウェア

ディープラーニングトレーニング