Generative AI

オープンソースの AI-Q NVIDIA Blueprint を通じてエンタープライズ データを用いてチャットする

Reading Time: 2 minutes

企業データは爆発的に増加しており、メール、レポート、Slack メッセージ、データベースもペタバイト単位で蓄積され、誰も読み切れないほどです。市場調査会社 Gartner によると、従業員が大量の情報の中で答えを探し求めるという状況は変わっておらず、「組織内の利用可能なデータの 68% が未使用のまま」であるといいます1

この状況を打開すべく、本日提供開始になったのが AI-Q です。AI-Q はオープンソースの NVIDIA Blueprint で、これを使うと自社のナレッジをすぐに利用できるようになります。AI-Q は無料のリファレンス実装で、汎用人工知能エージェント (AGA) の構築を可能にします。AGA はエンタープライズ データに接続し、最新の AGI モデルを使用して複数のマルチモーダル データ ソース間でリーズニングを行い、包括的で高速かつ正確な回答を安全かつ大規模に提供します。

AI-Q は、AI 搭載エージェントを構築するための、開発者にとって使いやすいワークフロー サンプルを提供します。これにより、以下が可能になります。

  • 多様なソース (テキスト、PDF、画像、表、データベース) からマルチモーダル データを抽出する
  • 高速セマンティック検索、検索拡張生成 (RAG)、Tavily を活用した Web 検索を使用して情報を取得し理解する 
  • 高度なエージェント型ワークフローを使用してリーズニングや計画を行い、行動を起こす
  • 従業員に安全かつ効率的に実用的なインサイトを提供する

このブログでは、AI-Q NVIDIA Blueprint の機能とコンポーネントについて、ユース ケースの例とともに説明します。

AI-Q Blueprint の主なビルディング ブロックには、1) パフォーマンスが最適化された NVIDIA NIM、2) NVIDIA NeMo Retriever マイクロサービス、3) NVIDIA NeMo Agent ツールキットの 3 つがあります。これらの AI ビルディング ブロックを使用して、あらゆる分野や業界向けに、堅牢でスケーラブルかつ信頼性の高い AI エージェントを作成することができます。

私たちは、AI-Q Blueprint を使用して AI エージェントを構築する方法を実証するために、AI-Q Research Assistant Blueprint を作成しました。この blueprint により、何時間もかかっていた調査を AI エージェントが数分でまとめることができます。AI-Q Blueprint のビルディング ブロックを使用することで、AI エージェントは多くのデータソースに接続してリーズニングを行い、営業、IT、ソフトウェア開発、マーケティング、人事、財務といった、企業のビジネス機能を支援することができます。

AI エージェントは、創薬プロセスの改善にも役立ちます。NVIDIA はこれを実証するために、AI-Q Blueprint を使用する開発者向けに、Biomedical AI-Q Research Agent Blueprint を作成しました。このバイオメディカル向け AI リサーチ エージェントを使用すると、何時間もかかる医学研究をより迅速にまとめることができ、最終的には医薬品の研究開発に必要となる時間を短縮できます。

AI-Q Blueprint ワークフローのコンポーネントと機能

AI-Q Blueprint ワークフローの主なコンポーネントと機能は次のとおりです。

  • マルチモーダル PDF データ抽出
  • データ取得のための RAG
  •  AI による高度なリーズニング
  • エンタープライズ用にカスタマイズされた AI
  • マルチエージェント システムのオブサーバビリティおよび最適化

多様なソースからのマルチモーダル PDF データ抽出

図 1. RAG と NeMo Retriever、リーズニング用の NVIDIA Llama Nemotron、およびレポート生成用の NVIDIA NIM を統合した AI-Q Blueprint のアーキテクチャ図

ワークフローは、マルチモーダル PDF データの取り込みから始まります。エンタープライズ データは、テキスト ドキュメント、PDF、画像、表など、さまざまな形式で保存されています。AI-Q Blueprint は、NVIDIA NeMo Retriever の抽出マイクロサービスを使用して、構造化データ、半構造化データ、非構造化データを取り込み、インデックスを作成します。この処理は、アクセラレーテッド コンピューティングにより、最大 15 倍の速度で、ペタバイト規模で実行されます。

RAG で効率的かつ正確なデータ取得が可能に

NVIDIA NeMo Retriever と RAG により、エンタープライズ データは継続的に抽出、埋め込み、インデックス化されるため、システムは常に最新の情報を使用して動作します。ベクトルは、 NVIDIA cuVS によって高速化されたデータベースに保存されており、Docker Compose を介して管理されるため、スケーラブルで効率的な展開に対応できます。このアーキテクチャにより、ユーザーのクエリへの回答はデータに基づいた応答で行われ、パイプライン全体でプライバシー制御が適用されます。

高度な AI リーズニングで自律的な意思決定とプランニングを実現

AI-Q Blueprint は Llama Nemotron モデルを使用し、高度なリーズニング機能を提供します。高度なリーズニング機能は、動的な問題分解、反復的な改良、入力コンテキストを意識した意思決定を通じて、より正確な検索とリランキングを実現します。この継続的なリフレクション プロセス (=モデルの出力が正しいかどうかを、モデル自身が判断するプロセス) により、生成される出力の品質と信頼性が向上するため、AI エージェントはさまざまなデータ ソースからより正確かつ詳細に、実用的なインサイトを提供できるようになります。NVIDIA Llama Nemotron モデルは、リーズニングのオン/オフを動的に切り替える独自の機能を備えており、パフォーマンスとコスト効率のバランスを取りながら、最大 5 倍の推論速度を実現します。

エンタープライズ AI のカスタマイズと統合で柔軟な開発が可能に

AI-Q は、ERP、CRM、データ ウェアハウス、ドキュメント、画像、チャット ログなど、幅広いデータ ソースと統合することで、社外秘のエンタープライズ データを活用する、ドメイン固有の AI エージェントを構築するための基盤を開発者に提供します。そのため、AI エージェントは組織固有のニーズに合わせて文脈に沿ったインサイトを提供できるようになります。AI-Q にはセットアップを容易にする包括的な開発ガイドが含まれており、Python 環境の設定、Docker によるデプロイメント、およびフロントエンドとバックエンド双方のサービスの管理について説明する、ステップバイステップの手順など、があります。

NVIDIA NeMo Agent ツールキットは多様なフレームワークに対応するため、一般的なエージェント型プラットフォームやツールの多くと統合が可能です。Agno (旧 Phidata)、CrewAI、LangChain、LlamaIndex、MemO、Semantic Kernel、Weave、Zep Cloud などのファーストパーティ プラグインをサポートおよび提供しています。これらの統合はモジュール式のプラグイン パッケージを通じて管理されるため、開発者はワークフロー要件に応じてツールキットの機能を拡張できます。Agent ツールキットはオープンであるため、コミュニティの他のメンバーがツールキットの統合をさらに拡張することが可能です。

このツールキットは、NVIDIA NIM や OpenAI などの大規模言語モデル (LLM) API への直接接続もサポートし、モデル コンテキスト プロトコル (MCP) と互換性があるため、MCP サーバーが提供するツールをNeMo Agent Toolkit から利用することができます。この柔軟なアーキテクチャにより、NeMo Agent Toolkitは、チームのプラットフォームを変更せずに、多様なテクノロジ スタックを用いた複雑なマルチエージェント ワークフローをオーケストレーションおよび最適化できます。これにより、NeMo Agent Toolkit はエンタープライズ AI 開発の統一的レイヤーとしての役割を側します。

スケーラブルなマルチエージェント システムを実現する AI の可観測性と最適化

スケーラビリティを担保したデプロイメントおよびオーケストレーションを実現するために、AI-Q Blueprint に含まれる NeMo Agent Toolkit は、クエリ生成、要約生成、生成物に関する Q&A といったコア プロセス全体の状態を管理するステートレス REST API を提供します。また、きめ細かなテレメトリ、設定可能なログ記録、トレーシング、リアルタイムのメトリクス収集機能などによって収集された使用状況の統計は、すべて OpenTelemetry 形式に変換されているため、業界標準の監視ツールとの統合が可能です。これによってシステム全体のトレーサビリティが実現するため、企業はパフォーマンスを監視し、ボトルネックを特定し、ビジネス インテリジェンスの生成方法に関する詳細なインサイトを得ることができます。

NeMo Agent Toolkit の Profiler は、エージェント レベルとツール レベルの両方で、トークンの使用状況、応答のタイミング、レイテンシといった詳細なメトリクスを追跡するため、動的なパフォーマンス チューニングとワークフロー仕様の予測が容易になります。これらの機能により、組織は AI エージェントのワークフローを継続的に評価、デバッグ、改良し、精度と効率性を向上させることができます。最終的には、信頼性、透明性、パフォーマンスに優れた大規模なエージェント型 AI システムをサポートできます。

エージェント型 AI ツールキットで医療向け AI エージェントを最適化

Therapyside の Maia は、もともとはセラピストの質問に答えるシンプルな AI アシスタントでしたが、いまはスケジュール管理、支払い追跡、リソース提供といった重要な管理タスクをプラットフォーム内で直接自動化する強力なリーズニング エージェントに進化しています。Maia の進化により、臨床医は患者 1 人あたり 1 日で最大 22 分の時間を節約でき、その分患者のケアに集中できるようになっています。Maia のリーズニング ループは、ツール呼び出しとエラー処理をオーケストレーションする NVIDIA NeMo Agent ツールキットと、NVIDIA NeMo Retriever を用いた RAG を使用して構築されました。

Pangaea Data は、AI を活用して患者の構造化データおよび非構造化データを既存の臨床ガイドラインに照らし合わせて分析するプラットフォームを構築しました。AstraZeneca の希少疾患部門である Alexion との協力のもと、Pangaea Data は希少疾患患者の検出を加速させています。NeMo Agent Toolkit を使用することで、両社は重要なデータ ポイントの取得精度を 98% に高め、開発ワークフローを最適化しました。これにより、臨床スコア計算ツールの設定時間が数週間から数日に短縮されました。

フィードバックから予測へ: AI エージェントの学習機能と改善能力を向上

AI エージェントが本番環境で信頼性の高い結果を提供するには、継続的な評価と最適化が不可欠です。NeMo Agent Toolkit によって、開発者は詳細なテレメトリ データとプロファイリング データにアクセスできるため、エージェントのパフォーマンスを簡単に監視し、改善すべき領域をピンポイントで特定できます。データ フライホイール構築のための NVIDIA Blueprint (NVIDIA NeMo マイクロサービス上に構築されたリファレンス アーキテクチャ) を使用することで、開発者はエージェントの継続的な学習と適応を可能にし、フィードバックの収集とモデルの最適化のプロセスを自動化して、エージェント システムのパフォーマンスを向上させることができます。ツールキットの評価機能とプロファイリング機能をデータ フライホイールと統合する方法は、NVIDIA のノートブックでご確認ください。

AI-Q Blueprint により、企業は自社の AI Data Platform (NVIDIA 認定ストレージ プロバイダーが提供する高速ストレージ システム) の価値を理解できるようになります。例えば、VAST Data の AI Operating System は NVIDIA AI-Q と統合し、エンタープライズ データから継続的に学習するリアルタイムのマルチモーダル AI パイプラインを実現したことで、業界全体に影響を与える画期的な AI ソリューションが一歩前進しています。VAST は、ヨーロッパ最大級の資産管理サービス会社である CACEIS と連携して、顧客との会議のキャプチャ、文字起こし、分析を安全に行い、そのインサイトを即座に行動に移すリアルタイム AI プラットフォームを構築しています。

今すぐ始めましょう

エンタープライズ データの潜在能力を最大限に引き出す準備をしませんか? AI-Q NVIDIA Blueprint は GitHub で公開中です。ここには、利用開始するうえで必要なものがすべて揃っています。

  • ステップバイステップの環境設定
  • RAG サービス、LLM モデル、フロントエンド/バックエンド システムの展開ガイド
  • ローカルでの開発およびテストの手順
  • トラブルシューティングと FAQ
  • NVIDIA Launchable: AI-Q Research Assistant のサンプルをすぐに立ち上げて使うことができる、ワンクリックで展開可能な GPU 開発環境

組織のナレッジへのアクセス方法に変革を起こしましょう。意思決定を支援し、イノベーションを推進する、堅牢なインテリジェンス リサーチ エージェントの構築を始めるなら、今です。

GitHub でコードとドキュメントを参照し、エンタープライズ AI の未来を築く開発者コミュニティに参加しましょう。NVIDIA のエージェント型 AI に関する会話にもご参加ください。フォーラムまたは Discord で参加できます。

利用開始にあたってサポートが必要ですか? Deloitte、EY、Quantiphi、SoftServe、Tech Mahindra などの NVIDIA 統合パートナーは、AI-Q Blueprint コンポーネントを使用して、組織がエージェント型 AI アプリケーションを本番環境に導入できるよう支援するソリューションを構築しています。

1. Gartner®、「Predicts 2025: Privacy in the Age of AI and the Dawn of Quantum (2025 年の予測: AI 時代のプライバシーと量子コンピューティング時代の到来)」、2025 年 1 月。GARTNER® は、Gartner Inc. および/または米国内外の関連会社の登録商標およびサービス マークであり、本書では許可を得て使用しています。無断複写/転載を禁じます。


関連情報

翻訳に関する免責事項

この記事は、「Chat With Your Enterprise Data Through Open-Source AI-Q NVIDIA Blueprint」の抄訳で、お客様の利便性のために機械翻訳によって翻訳されたものです。NVIDIA では、翻訳の正確さを期すために注意を払っておりますが、翻訳の正確性については保証いたしません。翻訳された記事の内容の正確性に関して疑問が生じた場合は、原典である英語の記事を参照してください。

Tags