Retrieval Augmented Generation (RAG)

2025 年 2 月 4 日
NVIDIA Spectrum-X ネットワーキング プラットフォームと NVIDIA パートナーが AI ストレージを最大 48% 高速化
帯域幅が増えることで、AI ワークフローにおけるストレージに依存するステップの完了にかかる時間が短縮できるので、トレーニングにおいてはジョブの完了にかかる時間が短縮され、推論においてはトークン間の遅延が減少します。
2 MIN READ

2024 年 12 月 11 日
NVIDIA AI Blueprint でカスタマー サービス向けの AI バーチャル アシスタントを作成する 3 つの構成要素
NIM と NeMo™ Retriever を活用したリファレンス アプリケーションである NVIDIA NIM™ AI Blueprint を使用して、あらゆる業界のカスタマー サービスを変革しましょう。
2 MIN READ

2024 年 11 月 4 日
NVIDIA AI Workbench によるハイブリッド環境におけるスムーズなコラボレーションと迅速なプロトタイピング
データ サイエンス、AI、機械学習などのプロジェクトを合理化する無料の開発環境マネージャー「NVIDIA AI Workbench」の、最新リリースでの主要な新機能とユーザーから要望のあった更新についてご紹介します。
3 MIN READ

2024 年 10 月 28 日
NVIDIA GH200 Superchip が、Llama モデルとのマルチターン インタラクションの推論を 2 倍高速化
NVIDIA GH200 Grace Hopper Superchip を活用し、システム スループットを犠牲にすることなく、x86 ベースの NVIDIA H100 サーバーと比較して、Llama 3 70B モデルでマルチターンでユーザーとのやり取りする場合、TTFT を最大 2 倍に向上させる方法について解説します。
2 MIN READ

2024 年 9 月 25 日
NVIDIA NIM Agent Blueprint で AI アプリ向けのデジタル ヒューマン インターフェイスを構築する
デジタル ヒューマン インターフェイスを追加してチャットボット アプリケーションをパーソナライズし、検索拡張生成 (RAG) を使用して、スムーズで人間のようなやりとりを提供するサービスを構築してみませんか?
2 MIN READ

2024 年 6 月 28 日
NVIDIA NIM による財務分析の変革
金融サービスでは、ポートフォリオ マネージャーやリサーチ アナリストが膨大な量のデータを丹念に精査し、投資で競争力を高めています。
4 MIN READ

2024 年 3 月 20 日
マルチモーダル検索拡張生成 (RAG) の簡単な紹介
マルチモダリティ (複数の種類のデータ) を扱う上での課題と、マルチモーダル RAG パイプラインを構築するためのアプローチについてご紹介します。
3 MIN READ

2024 年 3 月 18 日
RAG アプリケーションを 4 つのステップでパイロットから本番環境に移行する方法
セキュリティ、サポート、安定性を提供する NVIDIA AI Enterprise は、企業による RAG アプリケーションのパイロットから本番環境への移行を支援します。
3 MIN READ

2023 年 11 月 15 日
LLM テクニックの習得: LLMOps
この投稿では、生成 AI アプリ開発の概要を説明し、GenAIOps と LLMOps の概念を定義し、それらを MLOps と比較します。
3 MIN READ