1. はじめに

AI は、小売、製造、医療、自動車など、多くの業界に革命的な変化をもたらしています。こうした業界の企業は、AI を業務の中で利用可能なものにして、物体や環境の認識に活用したり、AI でなければ不可能なリアルタイムのインサイトを生み出したりしています。

ある特定のユース ケースに合わせてカスタム AI ソリューションを構築し、AI を研究から実用に移すのは、簡単な作業ではありません。まず、学習に必要な代表的なデータを大量に収集し、アノテーションを行うことから始める必要があります。また、最先端のディープラーニング モデルを実現するには、ドメインに関する相当な知識が必要で、データ サイエンティストは、典型となるモデルに到達するまでに何度も反復と実験を行わなければなりません。これは、非常に時間のかかる作業です。そして最後に、学習が完了したモデルを、高スループットかつ低レイテンシの性能を発揮するよう最適化して、ようやく展開できるようになります。

AI の構想から運用までを迅速に進めるには、学習済みのモデルを適応させ調整し、最適なモデルを作成して、多くの業界におけるユース ケースの急増と多様性に対処するのが、最も現実的で拡張性のある方法です。この方法によって、プロトタイプの作成とカスタマイズを速やかに行い、あらゆる環境で求められる要件を満たせるようになります。

たとえば、小売業向けの分析アプリケーションを開発しているとします。視覚的な条件がまったく同じ店舗や配送センターは 2 つと存在しません。アプリケーションを利用する環境の照明の条件や、特定の物理空間での配置といった変数に基づいて、各推論モデルをある程度カスタマイズする必要があります。同様に、工場のフロアに AI ソリューションを展開する場合は、さまざまな部品をさまざまな組み立てラインで検査することになる可能性があります。このように、環境に適応するためには、モデルのカスタマイズが欠かせません。

NVIDIA TAO Toolkit は、転移学習のメリットを活かして、最先端のモデルの迅速なトレーニング、適応、最適化、展開を可能にすることで、こうした問題を解決します。転移学習とは、学習済みの特徴量を、あるモデルから別のモデルに活用する学習手法です。この転移学習を用いることで、ピンポイントのニーズに合わせてモデルをカスタマイズするために必要なデータ量とトレーニング時間を削減できます。

TAO Toolkit は、使いやすい CLI ベースのソリューションで、Jupyter Notebook ベースのガイド付きワークフローが含まれており、開発プロセスをすばやく開始できる NVIDIA の学習済みモデルが数十種類用意されています。TAO Toolkit が提供するモデル アーキテクチャは最先端のものであり、コンピューター ビジョンと対話型 AI の両方の分野で、一般的な問題の多くを解決する実効性が確認されています。以下はユース ケースの一部です。

  • コンピューター ビジョン: オブジェクト検出、分類、キーポイント推定
  • 対話型 AI: 自動音声認識 (ASR)、自然言語処理 (NLP)

モデルと転移学習を活用することで、業界を問わずさまざまなユース ケースに対応できます。このホワイトペーパーでは、TAO Toolkit を使用したユース ケースとベスト プラクティスを紹介します。取り上げているのは以下のユース ケースです。