2D と 3D のデジタルヒューマンアバターによる AI エージェントインターフェイスオプションの拡張

Reading Time: 2 minutes

ユーザーが生成 AI アプリケーションを使ってやり取りする際には、テキスト、音声、デジタルアバターなど複数のコミュニケーションオプションを利用することができます。

従来のチャットボットやコパイロットアプリケーションでは、ユーザーが問い合わせを入力し、テキストベースの応答を受信するテキストインターフェイスを使用しています。ハンズフリーのコミュニケーションでは、自動音声認識 (ASR: Automatic Speech Recognition) や音声合成 (TTS: Text-To-Speech) などの音声 AI 技術により、電話を使用したカスタマーサービスなどのシナリオに最適な口頭によるやり取りが容易になります。さらに、デジタルアバターに音声機能を持たせることで、ユーザーがアプリケーションを視覚的に使用できるため、ダイナミックなインターフェイスを提供できます。Gartner によると、2028 年までに、従業員 500 名以上の組織の 45% が、人的資本の能力拡大のために、 AI アバターの従業員を活用するようになるそうです。¹

デジタルアバターのスタイルは様々で、フォトリアリスティックな 3D または 2D のアバターが適しているケースもあれば、定型化されたアバターや漫画のようなアバターの方が適しているケースもあります。

3D アバターは、リアルな動きと写実性を再現し、完全な没入体験を提供します。このようなアバターの開発には、複雑なボディーアニメーションや高品質のレンダリングが必要となるため、専門的なソフトウェアや技術的な専門知識が必要になります。
2D アバターは開発が迅速で、Web に組み込みソリューションに最適です。インタラクティブな AI の作成に合理的なアプローチを提供し、デザインやアニメーションにはアーティストが必要になることが多いですが、技術的なリソースの面はそれほど負担になりません。

フォトリアリスティックなデジタルヒューマンの作成を始めるにあたり、カスタマーサービス向けデジタルヒューマンの NVIDIA AI Blueprint は、さまざまなユースケースに合わせてカスタマイズすることができます。この機能は現在、NVIDIA Maxine Audio2Face-2D NIM マイクロサービスのサポートに含まれています。さらに、この Blueprint では、3D アバター開発者が Unreal Engine を使用できるよう、レンダリングに柔軟性を持たせています。

エージェントアプリケーションに会話するデジタルアバターを追加する方法

デジタルヒューマン向け AI Blueprint では、ユーザーが NVIDIA ACE 技術を活用した AI エージェントと対話します (図 1)。

ユーザーによる音声入力は、さまざまな NIM マイクロサービス間の通信を調整する ACE エージェントに送信されます。ACE エージェントは、Riva Parakeet NIM を使用して音声をテキストに変換し、そのテキストは RAG パイプラインで処理されます。RAG パイプラインでは、NIM マイクロサービスの埋め込みとリランクを行う NVIDIA NeMo Retriever と LLM NIM を使用して、保存されたドキュメントから関連するコンテキストを用いて応答します。

最後に、Riva TTS を介してこの応答を音声に変換し、Audio2Face-3D NIM または Audio2Face-2D NIM を使用してデジタルヒューマンをアニメーション化します。

AI エージェントアプリケーションを設計する際に考慮すべきポイント

グローバル企業では、言語の壁によるコミュニケーションの障害が業務の妨げとなることがあります。多言語機能を備えた AI 搭載アバターを使用すれば、言語の壁を超えた円滑なコミュニケーションを取ることができます。デジタルヒューマン AI Blueprint は、Riva ASR やニューラル機械翻訳 (NMT: Neural Machine Translation) に加え、インテリジェントな割り込みやバージイン機能を備え、ユーザーの話し方や言語に柔軟に対応できる、人間らしい対話型 AI を実現します。

デジタルヒューマン AI エージェントの主な利点の 1 つは、従業員と顧客の両者にとって「常時稼働する」リソースとして機能できることです。RAG を搭載した AI エージェントは、やりとりから継続的に学習し、時間の経過とともに改善していくため、より正確な対応とより優れたユーザー体験を提供することができます。

デジタルヒューマンインターフェイスを検討している企業にとって、適切なアバターとレンダリングオプションの選択は、ユースケースやカスタマイズ設定に依存します。

ユースケース: 3D アバターは、実店舗やキオスク (無人端末) など、主に 1対 1 のやりとりのような、非常に没入感の高いユースケースに最適ですが、2D アバターは、Web やモバイルの対話型 AI ユースケースに効果的です。
開発とカスタマイズの設定: 3D やアニメーションの専門知識を持つチームは、そのスキルを活用して没入感のある超リアルなアバターを作成できます。一方、反復作業やカスタマイズを迅速に行いたいチームには、シンプルな 2D アバターが有効です。
スケーリングの考慮すべきポイント: アバターと対応するレンダリングオプションを評価する際に、スケーリングは考慮すべき重要なポイントです。ストリームのスループットは、特に 3D アバターの場合、使用するキャラクターアセットの選択と品質によって大きく異なります。希望する出力解像度や選択するレンダリングオプション (Omniverse Renderer または Unreal Engine) は、ストリームあたりの計算フットプリントを決定する上で重要な役割を果たします。

NVIDIA Audio2Face-2D では、顔写真と音声入力だけでリアルな 2D アバターを作成できます。簡単でシンプルな構成のため、開発者はデジタルヒューマンのユースケースに合わせたアバターやアニメーションを迅速に繰り返し作成できます。リアルタイム出力とクラウドネイティブのデプロイにより、2D デジタルヒューマンは、インタラクティブなユースケースや、インタラクティブな Web 組み込みソリューション向けのストリーミングアバターに最適です。

たとえば、複数のデバイスに AI エージェントをデプロイし、Web またはモバイルファーストのカスタマージャーニーにデジタルヒューマンを導入しようとしている企業には、2D アバターはハードウェア要件が軽減するのでメリットがあります。

3D のフォトリアリスティックなアバターは、高い共感が要求されるユーザーエンゲージメントを必要とするユースケースに、比類のない没入体験を提供します。NVIDIA Audio2Face-3D とアニメーション NIM マイクロサービスは、繊細な頭部と身体のアニメーションとともにブレンドシェイプを生成し、没入感のあるフォトリアリスティックなアバターを作成することで、3D キャラクターをアニメーション化します。デジタルヒューマン AI Blueprint は、3D アバターのレンダリングオプションをとして、Omniverse レンダラーと Unreal-Engine レンダラーをサポートしており、開発者が選択したレンダリングオプションを柔軟に統合できるようになりました。

デジタルヒューマンが企業を強化する方法については、NVIDIA API カタログにアクセスして、さまざまなアバターのオプションをご覧ください。

デジタルアバターを始める

Audio2Face-2D と Unreal Engine NIM マイクロサービスを使用した実践的な開発については、ACE 早期アクセスに申し込むか、デジタルヒューマン AI Blueprint の技術ブログにアクセスして、チャットボットアプリケーションをパーソナライズするためにデジタルヒューマンインターフェイスを追加する方法について学ぶことができます。

¹Gartner®, Hype Cycle for the Future of Work, 2024 by Tori Paulman, Emily Rose McRae, etc., July 2024
GARTNER is a registered trademark and service mark of Gartner, Inc. and/or its affiliates in the U.S. and internationally and is used herein with permission. All rights reserved.

2D と 3D のデジタルヒューマンアバターによる AI エージェントインターフェイスオプションの拡張

エージェントアプリケーションに会話するデジタルアバターを追加する方法

AI エージェントアプリケーションを設計する際に考慮すべきポイント

デジタルアバターを始める

関連情報

Tags

About the Authors

2D と 3D のデジタル ヒューマン アバターによる AI エージェント インターフェイス オプションの拡張

エージェント アプリケーションに会話するデジタル アバターを追加する方法

AI エージェント アプリケーションを設計する際に考慮すべきポイント

デジタル アバターを始める

関連情報

Tags

About the Authors

2D と 3D のデジタルヒューマンアバターによる AI エージェントインターフェイスオプションの拡張

エージェントアプリケーションに会話するデジタルアバターを追加する方法

AI エージェントアプリケーションを設計する際に考慮すべきポイント

デジタルアバターを始める