TAO Toolkit
お金をかけて AI の専門知識を習得しなくても、AI 開発スピードを 10 倍に加速できます。トレーニングをスピードアップして、精度の高い、高性能のドメイン別 AI モデルをすばやく作成できます。
ビジネスの課題を解決するための AI/ML モデルを一から作成するのは、お金と時間がかかります。転移学習 は、学習済みの特徴量を、既存のニューラル ネットワーク モデルから新しいモデルに抽出するときによく使われる手法です。NVIDIA TAO Toolkit は AI/DL フレームワークの複雑さを抽象化する AI ツールキットです。高品質の学習済みモデルを使用するため、わずかな量のデータでも運用品質のモデルをすばやく構築できます。
AI アプリやサービス構築のためのツールキットとして、大規模なデータの収集やラベリングにかかるコスト、AI/ML モデルを一からトレーニングする負担などを解消します。
TAO を使用すると、NVIDIA の運用品質の学習済みモデルをそのままデプロイするか、コンピューター ビジョンや対話型 AI などのさまざまなユースケースに合わせてモデルを微調整して使用できます。TAO は、AI 作成のための UI ベースのガイド付きワークフロー、TAO (Train, Adapt and Optimize) プラットフォームの中核的なコンポーネントです。

手間をかけずにトレーニング
最先端の AI を最小限のコーディングでアプリケーションに追加。AI フレームワークの専門知識は不要。
精度の高い AI
専用の学習済みモデルを利用して、障壁を取り除き、高いネットワーク精度を獲得。
スループットを向上
デプロイ コストを大幅に削減し、高スループットの推論を実現。
コンピューター ビジョンや対話型 AI 向けの、運用カスタム モデルをすばやく作成
一からモデルを作成して最適化したり、最適化されていないオープン ソース モデルを利用したりするなど、アプリケーション強化に時間をかけるのはやめましょう。TAO は NVIDIA の運用品質の学習済みモデルを使用して、エンジニアリング作業を 10 倍以上高速化し、高いスループットと精度を短期間で達成します。これらの AI モデルはNGCカタログから無料ですぐにダウンロードできます。

一般的な AI タスク向けの学習済みモデル
コンピューター ビジョンの学習済みモデル
さまざまな業界ユースケース向けに構築された NVIDIA の学習済みモデルを使用すると、AI プロジェクトをすばやく立ち上げて、概念実証 (PoC) から運用まで迅速に進められます。AI モデルは、混雑空間における人体の検出と集計、車両の検出と分類、道路料金所でのナンバー プレートの検出と認識、駐車管理、医療施設の患者の心拍数監視など、一般的なコンピューター ビジョンのユースケースにそのまま利用できます。
人体検出
駅などの混雑した空間で人、荷物、顔を検出します。顧客体験の向上、歩道の混雑状況の分析などに活用されます。
ナンバー プレートの検出と認識
車両のナンバー プレートを検出および識別します。違法駐車の取締り、自動料金所、交通量監視など、さまざまなアプリケーションへに応用されます。
車両の検出と分類
スマート シティ向けに車種や車のメーカー/モデルを検出します。
車両検出モデルと車両分類モデル
VehicleMakeNet
車を 20 の人気カー ブランドのいずれかに分類 (Acura、Audi、BMW、Chevrolet、Chrysler、Dodge、Ford、GMC、Honda、Hyundai、Infiniti、Jeep、Kia、Lexus、Mazda、Mercedes、Nissan、Subaru、Toyota、Volkswagen)。
NGC で見る人体検出モデル
ナンバー プレートの検出と認識モデル
車両検出モデルと車両分類モデル
VehicleMakeNet
車を 20 の人気カー ブランドのいずれかに分類 (Acura、Audi、BMW、Chevrolet、Chrysler、Dodge、Ford、GMC、Honda、Hyundai、Infiniti、Jeep、Kia、Lexus、Mazda、Mercedes、Nissan、Subaru、Toyota、Volkswagen)。
NGC で見る姿勢推定モデル
視線推定モデル
顔のランドマーク モデル
心拍数推定
コンピューター ビジョンを使用して心拍数を推定します。ヘルスケアや患者モニタリングで使用します。
心拍数推定モデル
ジェスチャーと感情
さまざまな手の動きと感情を検出するコンピューター ビジョン。
セグメンテーション
フレーム内の複数の物体の各インスタンスをピクセル レベルで識別します。
セグメンテーション モデル
セマンティック セグメンテーション - UNET
ピクセル レベルの画像分類を実行。画像内のあらゆるピクセルをクラス ラベルに割り当て。クラス内のすべてのインスタンスを同じラベルに収集。
NGC で見る心拍数推定モデル
セグメンテーション モデル
セマンティック セグメンテーション - UNET
ピクセル レベルの画像分類を実行。画像内のあらゆるピクセルをクラス ラベルに割り当て。クラス内のすべてのインスタンスを同じラベルに収集。
NGC で見るオブジェクト検出
フレーム内の 1 つまたは複数の物体を検出して、その周囲にバウンディング ボックスを配置します。
画像分類
画像の特徴量に基づいて、画像を指定のクラスに容易に分類します。対象ネットワーク アーキテクチャ: ResNet、GoogLeNet、EfficientNet、VGG、DarkNet、MobileNet、CSPDarkNet
画像分類モデル
テキスト認識モデル
オブジェクト検出モデル
画像分類モデル
画像の特徴量に基づいて、画像を指定のクラスに容易に分類します。対象ネットワーク アーキテクチャ: ResNet、GoogLeNet、EfficientNet、VGG、DarkNet、MobileNet、CSPDarkNet
NGC で見るモデル アーキテクチャを使用して最先端の精度を実現
TAO Toolkit では、ResNet、VGG、FasterRCNN、RetinaNet、YOLOv3/v4 など 100 種以上のニューラル ネットワーク アーキテクチャ を使用して、特定のユースケース向けに自前のデータでモデルを微調整できます。また、一からトレーニングを行う代わりに、NVIDIA の共通 AI タスク向けの運用品質の多目的モデル を使用することも可能です。
10/18/34/50/101 | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
| ✔ | |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |||
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |||
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ||||
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |||
✔ |
|
|
|
| ✔ |
| ||||
✔ |
| ✔ | ✔ |
|
| ✔ | ✔ |
TAO Toolkit は、人気のネットワーク アーキテクチャとバックボーンを利用して、データのトレーニング、微調整、プルーニングを行った後、高度に最適化された精度の高い AI モデルをエクスポートして、高スループットの推論を実現します。
最先端の AI モデルをデプロイする
モデルのプルーニングと量子化認識トレーニングで推論を高速化
AI ソリューションを構築する企業は、メモリに制約があっても高速な推論を実行できる、予測効率と精度の高い AI モデルを求めています。コンピューター ビジョンのユースケースでは、多くの場合、プルーニングしていない AI モデルは性能の低い端末用に最適化されていません。限られたデータセットで問題を解決したい場合は、転移学習とパーティション プルーニングによってチャネル密度を向上することで、高スループットの推論を実現します。
詳細を見る一般に、AI モデルは低精度で実行する方が、計算効率が高くなります。INT8 精度 の AI モデルは、浮動小数点演算で推論を実行するよりも格段に高速です。FP32/16 の重みをトレーニング後に INT8 に量子化すると、量子化のエラーによりモデルの精度が低下することがあります。TAO Toolkit の量子化認識トレーニング (QAT) 機能は、トレーニング段階で重みを量子化することにより、トレーニング後の量子化と比べても FP16/FP32 モデルに比肩する精度を実現できます。TAO Toolkit の QAT を使用すると、INT8 の演算精度での推論を最大で 2 倍に高速化しながら、FP16 と同等の精度を維持できます。
詳細を見る224x224x1 224x224x1 25x25x1 | |||||||||||||
Jetson Nano、TX2 NX、AGX Xavier、T4、Ampere A100 GPU などのプラットフォーム全体で、NVIDIA の学習済みモデルを使用して推論パフォーマンスをさらに高めましょう。バッチ サイズやその他のモデルについては、パフォーマンス データシートの詳細を参照してください。
注意: * Jetson Nano と TX2 NX での FP16 推論
DEEPSTREAM SDK による強力なエンドツーエンド ビジョン AI パイプライン
DeepStream SDK と TAO Toolkit を使用して、ピクセルやセンサーのデータを実践に役立つインサイトに変換する、エンドツーエンドのサービスやソリューションを構築しましょう。TAO Toolkit が生成する運用向けの AI モデルは、NVIDIA DeepStream SDK や TensorRT と容易に統合して高スループットの推論を実行できます。スマート シティやスマート病院、工業検査、ロジスティクス、交通量監視、小売分析などさまざまなアプリケーションで高いパフォーマンスを発揮します。
詳細を見る
ストリーム密度を最大限に高めて自在にデプロイできる DeepStream SDK
対話型 AI の学習済みモデル
対話型 AI 用 TAO Toolkit は、自動音声認識 (ASR) や自然言語処理 (NLP) のユースケースをサポートしています。すぐに使える NGC の学習済みモデルを使用すると、インテント認識、エンティティ認識、感情分析などを必要とする、個人向けのリアルタイム コール センター体験、スマート キオスク、高品質サービスを簡単に設計できます。
音声認識 (ASR)
自動音声認識 (ASR) は人間の音声を取り込み、読解可能なテキストに変換します。
自然言語処理 (NLP)
自然言語理解 (NLU) は入力としてテキストを取り込み、コンテキストと意図を理解し、インテリジェントな返答を生成します。
自然言語処理 (NLP) モデル
音声認識 (ASR) モデル
自然言語処理 (NLP) モデル
最先端の対話型 AI モデルをデプロイする
Rivaを活用した強力なエンドツーエンド AI パイプライン
Riva は、最先端のディープ ラーニング モデルを使用してマルチモデルの対話型 AI サービスを構築、デプロイする、開発者向けの完全アクセラレーション アプリケーション フレームワークです。TAO Toolkit を使用すると、企業の開発者が簡単に自社のデータで最先端のモデルを微調整し、特定の文脈において高い精度を達成できます。最適化された学習済みモデルと転移学習を使用すれば、転移学習でない手動アプローチの 1/10 のデータ量でアプリケーションのトレーニングとデプロイが可能です。
詳細を見る
学習済みモデル、TAO Toolkit、Riva を使用してエンドツーエンドの対話型 AI パイプラインをトーレ二ングしデプロイ
データ生成とデータ アノテーションのパートナー
AI トレーニングには高品質のラベル付きデータが大量に必要です。NVIDIA は、トレーニングを高速化するため、データの作成とアノテーションに関して数社と提携しています。

各種ユース ケース向けに高品質なトレーニング データを提供

機械学習アプリケーション用にラベル付けしたデータを作成、管理する、コラボレーション型データ トレーニング プラットフォーム

AI や機械学習のモデル向けに、高品質なトレーニング データや、検証およびアノテーション ソリューションを提供
お客様の声
「有料道路の包括的な自動ナンバー プレート認識システム、INEX RoadView では、NVIDIA のエンドツーエンド ビジョン AI パイプラインと運用向け AI モデル、TAO Toolkit、DeepStream SDK を採用しています。これにより、エンジニアリング チームの開発時間を 60% 削減しただけでなく、Jetson Nano と Xavier NX を使用してカメラのハードウェア費用も 40% 抑えられました。その結果ベンダーは、唯一の標準 ALPR ソリューション、RoadView をすばやく確実にデプロイできました。こんなに優れたソリューションはありません」
INEX
「KION Group は、ブランド全体で堅牢な AI ベースの流通自動化ソリューションに取り組んでいます。運用のニーズやロジスティクスの最適化という課題に対処することで、フロー内の例外的な事象が大幅に減少します。最適化された NVIDIA の学習済みモデルは、イノベーション、エンジニアリング、デジタル トランスフォーメーション サービスに大きなメリットをもたらしています。すばやく作成したモデルを、TAO Toolkit で適宜微調整を行い、NVIDIA Deepstream でデプロイすることで、Jetson プラットフォームでのマルチストリーム密度を向上しています」
KION
「Quantiphi は、小売業界、メディアおよびエンターテイメント業界の Fortune 500 企業向けに、NVIDIA SDK を使用したリアルタイム ビデオ アナリティクス ワークフローを構築しています。TAO Toolkit を活用すると、トレーニングとモデル プルーニングをカスタマイズしてエッジの推論を効率的に高速化できます。DeepStream では、高スループットの推論パイプラインをクラウドで構築して Jetson NX 端末に簡単に移植できます」
Quantiphi
「開発者とサードパーティ ベンダーが Optra のスキル マーケットプレイスを活用して、インテリジェントな AI アプリをすばやく構築できるようにしています。エッジ AI 市場の新規参入者にとって、製品と市場投入までの時間を差別化できるかどうかが死活問題です。すぐに使える TAO Toolkit の MaskRCNN と DeepStream は簡単に統合できるため、研究開発チームの開発負担を 25% 軽減できました」
Lexmark Ventures
「NVIDIA の TAO Toolkit を使用すると、リアル タイムで簡単に車両やナンバー プレートを検出するトレーニングを実行できます。一からモデルを構築する必要がないため、短時間でモデルを開発し、さまざまなオプションを試せるようになりました」
Booz Allen Hamilton
「SmartCow は、港湾やドックでのターンアラウンド タイムを最適化する、ターンキー AIoT ソリューションを構築しています。TAO Toolkit を使用してトレーニングの反復作業を 1/9 に、データ収集とラベル付けの作業を 1/5 にまで減少させ、トレーニングのコストを半減させることができました」
SmartCow
「CVEDIA のセマンティック アルゴリズム技術は、オブジェクト検出や画像分類ネットワークの開発を加速させます。NVIDIA TAO Toolkit を使用することで、モデルの学習時間を半分に短縮し、同レベルのモデル精度とスループット性能を達成した」
CVEDIA
よく寄せられる質問
Latest Product News

Developer Tutorial
Learn how to train and optimize pose estimation model for real-time inference.

Developer Tutorial
Learn how to create a real-time number plate detection and recognition app.

Developer Tutorial
Learn how to train State-Of-The-Art Models for classification and object detection

Explore TAO Platform
NVIDIA TAO is an AI-model-adaptation platform that simplifies and accelerates the creation of enterprise AI.

GTC21 Talk
Learn how the world’s top AI teams combine pre-trained models and transfer learning tools to supercharge their AI vision development.
GTC21 Talk
Learn how to build and deploy a custom conversational AI app with NVIDIA TAO Toolkit and Riva

Success Story
Learn how Lexmark uses pre-trained models, TAO Toolkit ,and DeepStream to reduce AI skills design cycle by 25%.

Success Story
Explore how INEX leverages pre-trained models, TAO Toolkit ,and DeepStream to reduce development time and cost for toll road systems.