NVIDIA のコンピューター ビジョン
周辺環境を視覚的に認識、理解できるデバイスを実現するためには、スケーラブルで検証済みの卓越した性能のソフトウェアが必要です。
NVIDIA のソフトウェアは、モデルの開発から展開までを行う、個人開発者、高等教育機関、研究機関、企業をサポートし、エンドツーエンドのコンピューター ビジョン ワークフローを実現します。
コンピューター ビジョンとは、スマート カメラなどのデバイスで画像や映像を取得、処理、分析、解釈できるようにするテクノロジ分野です。たとえば、コンピューター ビジョン アルゴリズムを採用した運転支援システムでは、カメラやその他のセンサーを使用して、自動車の前後の画像を表示するだけでなく、そこに何があるのかを認識し、画像フレーム内の注目すべき領域や地点を特定して分類します。このように、コンピューター ビジョンが安全を担保することで、運転中に路上の障害物、他の車両、動物、人間を回避できるようになります。これに似た例として、一部の農家では、収穫量を増やすために、コンピューター ビジョン対応デバイスを利用して、広大な畑の中から自動的に雑草を識別したり、生育の良い作物などを特定したりしています。こうした今日のコンピューター ビジョンのタスクには、人工知能、具体的には人間の脳を模した機械学習の一種であるディープラーニングが用いられています。ディープラーニングを用いたコンピューター ビジョン モデルは、人間の専門家が必要とするよりもはるかに少ないインプットで同じレベルに適応し、デバイスのパフォーマンスを上げられるようになります。
コンピューター ビジョンの手法
ほとんどのコンピューター ビジョン手法では、まず、特定のタスク専用に大量のデータでトレーニングしたモデル (数学的アルゴリズム) を使用します。以下のような手法が一般的です。
分類
分類とは、画像または映像のフレーム内の物体を判断して分類することを指します。分類モデルは通常、大規模なデータセットを使用してトレーニングされ、犬、猫、いすなどの基本的な物体の識別や、路上に写っている車両の種類といったごく具体的な物体の識別を行います。分類出力の品質は、使用するトレーニング データに左右され、トレーニング データは、量が多く多様であるほど、精度が向上します。
検出
検出とは、画像または映像のフレーム内の 1 つまたは複数の物体の位置を特定することを指します。検出した物体の周囲に、アルゴリズムが長方形のバウンディング ボックスを出力して、画像内の位置を示します。物体検出器をトレーニングすることで、自動車、道路標識、人間、その他の物体などを検出できるようになります。
セグメンテーション
セグメンテーションとは、画像内のすべてのピクセルにラベルを割り当て、画像内の物体や関心領域の位置を正確に特定することを指します。これにより、ラベルが同じピクセルは、特性 (色やテクスチャなど) が類似します。セグメンテーション モデルは、MRI スキャンで腫瘍を自動的に検出するなど、医療画像処理に非常によく使用されます。
画像合成
画像合成とは、特定の物体やコンテンツを含む画像を作成または人工的に生成することを指します。一般的に、こうした画像や映像フレームの合成には、ニューラル ネットワークの一種である GAN (敵対的生成ネットワーク) が使用されます。画像合成の主な目的は、テキストからの画像生成で、GAN を使用してテキストの説明に基づいて画像を生成します。
NVIDIA の学習済みモデルでコンピューター
ビジョンを開発する
このようなモデルを自力で開発する場合、膨大な量のトレーニング データ、時間、専門知識が必要になります。しかし、幸いなことに、エキスパートでなくても始められる方法があります。NVIDIA では、独自のコンピューター ビジョン ソリューションの開発を始められる、事前に構築済みですぐに使える学習済みモデルを多数用意しています。まずは、GPU アクセラレーション ソフトウェア ハブの NGC にアクセスし、コンピューター ビジョンのモデルやリソース、その他のディープラーニングを用いた音声および自然言語処理のユース ケースやアプリケーション フレームワークをご確認ください。
エンドツーエンドのコンピューター ビジョン
ワークフローを開発
NVIDIA の学習済みモデル、TAO、DeepStream を使用して、手軽にエンドツーエンドのコンピューター ビジョン AI 開発プロセスを始めましょう。
各種 NVIDIA ソフトウェアのコンピューター ビジョン
NVIDIA の業界別ソフトウェア製品およびプラットフォームを使用して、コンピューター ビジョン アプリケーションを開発する方法をご紹介します。
医療
Clara
ジェスチャ認識、心拍数監視、マスク検出、病室での転倒を検知するための姿勢推定用のコンピューター ビジョン モデルを開発します。医療画像処理、医療デバイスとストリーミング ビデオ、スマート ホスピタルのワークフローを構築、管理、展開します。
詳細を見る自動運転
DRIVE
自動運転車 (AV) やインテリジェント コックピット (IX) 用のエンドツーエンド (E2E) のコンピューター ビジョン ソリューションを開発します。コンピューター ビジョン データの収集と生成、E2E シミュレーション プラットフォーム (DRIVE Sim) を使用した DNN モデルのトレーニングを行います。
詳細を見るビデオ ストリーミング
Maxine SDK
ビデオ エフェクト、オーディオ エフェクト、拡張現実を使用した、バーチャルでのコラボレーションおよびコンテンツ作成アプリケーションを作成します。
詳細を見る次世代のコンピューター ビジョンの構想
NVIDIA のコンピューター ビジョンに関する新たなテクノロジと革新的な研究をご紹介します。
NVIDIA の GPU アクセラレーション ライブラリと最適化プラットフォーム
NVIDIA のライブラリと最適化プラットフォームによって、GPU 上のコンピューター ビジョンを高速化する方法をご紹介します。
世界を支える NVIDIA のコンピューター ビジョン
よく寄せられる質問を確認する
コンピューター ビジョンは、今や研究開発にとどまらず、人々の生活を変える実用的なソリューションに活用されています。人工知能とハイパフォーマンス コンピューティングに関する NVIDIA の高度な専門知識は、世界にさまざまな可能性を生み出しています。
詳細を見る
コンピューター ビジョンの基礎を学ぶ
コンピューター ビジョンに馴染みがなければ、始める前に基礎を学びましょう。Deep Learning Institute のコースをお勧めします。これは 8 時間のコースで、ディープラーニングの基礎を学び、コンピューター ビジョンの実践演習を行います。ディープラーニング モデルを一からトレーニングする方法、学習済みモデルを使用する方法、各種モデル アーキテクチャをテストする方法、ディープラーニングのツールや手法、データセットを使用してモデルの精度を向上させる方法などを学びます。さらに、コースの修了後には認定資格を取得できます。
すぐに参加する
コンピューター ビジョンの最新情報
コンピューター ビジョンの実用例
さまざまな規模の企業が、コンピューター ビジョンの課題に取り組んでいます。スタートアップ企業から世界的メーカーまで、革新的なソリューションの実例をご紹介します。
ロー ビジョン (低視力) の人々の移動をサポート (Biel Glasses)
コンピューター ビジョンと AI によって製品の品質を向上 (Audi)
Maximo Visual Inspection を使用した NGC モデルの展開 (IBM)
成功に向けたパートナーシップ
世界規模で取り組むには、コミュニティの力が必要です。さまざまなニーズに応える優れたソリューションが、お客様の課題を解決いたします。