NVIDIA 技術ブログ
-
Generative AINVIDIA Nemotron の新しいモデル (Vision、RAG、ガードレール) で特化型 AI エージェントを開発
-
RoboticsNVIDIA Isaac Lab と Newton で四足歩行の移動ポリシーをトレーニングし、布の操作をシミュレートする
-
Generative AINVIDIA NIM により Stockmark 100B 日本語フルスクラッチ LLM が 2.5 倍高速化
-
Generative AIOpenRouter で NVIDIA Nemotron を使用してレポート生成 AI エージェントを構築する
-
Generative AINVIDIA Rubin CPX により、トークン コンテキストが 100 万を超えるワークロードの推論性能と効率が向上
最近の投稿
2025 年 11 月 18 日
NVIDIA テクノロジを活用した日本語医療音声エージェントの構築による臨床業務負担の軽減
日本の医療従事者がより多くの時間を患者に向き合えるようにする、音声 AI 技術を活用した音声対話エージェントの構築を NVIDIA のソリューションで加速しましょう。
5 MIN READ
2025 年 11 月 18 日
NVIDIA NIM と NVIDIA Blueprints で実現する日本語対応対話型エージェントの迅速な構築
NVIDIA NIM マイクロサービスと NVIDIA Blueprints を活用し、日本語環境に対応した Blueprints のカスタマイズを行うための実践的な手順を紹介します。
5 MIN READ
2025 年 11 月 10 日
NVIDIA Grove で Kubernetes 上の複雑な AI 推論を合理化する
Kubernetes クラスタ上で最新の ML 推論ワークロードを実行するための Kubernetes API である NVIDIA Grove が NVIDIA Dynamo 内でモジュール型コンポーネントとして利用できるようになりました。
3 MIN READ
2025 年 10 月 28 日
NVIDIA Nemotron の新しいモデル (Vision、RAG、ガードレール) で特化型 AI エージェントを開発
新しい Nemotron モデルを活用して、マルチモーダル エージェント、RAG パイプライン、コンテンツ安全性を備えた AI を構築する方法や、各モデルの特長、性能、チュートリアルを紹介します。
3 MIN READ
2025 年 10 月 24 日
LangGraph と NeMo Agent Toolkit ではじめる ReAct エージェント
AI エージェントの概念を簡潔に解説し、特に「ReAct (Reasoning and Acting) エージェント」に焦点を当てて、その仕組みと実装方法について詳しく説明します。
8 MIN READ
2025 年 9 月 29 日
NVIDIA Isaac Lab と Newton で四足歩行の移動ポリシーをトレーニングし、布の操作をシミュレートする
物理演算はロボティクス シミュレーションで重要な役割を果たし、
3 MIN READ
2025 年 9 月 25 日
NVIDIA NIM により Stockmark 100B 日本語フルスクラッチ LLM が 2.5 倍高速化
最適化コンテナーとして即時に API 化できる NIM は、大規模 LLM 導入時のさまざまな課題を解決します。NIM 対応した日本発の「Stockmark-2-100B-Instruct」を是非お試しください。業務利用に適した高精度な日本語 LLM がすぐに活用可能です。
1 MIN READ
2025 年 9 月 15 日
OpenRouter で NVIDIA Nemotron を使用してレポート生成 AI エージェントを構築する
AI エージェントを構築する上で重要な、基本的な概念から複雑なエージェント型システム実装までステップバイステップでご紹介します。
6 MIN READ
おすすめ
2025 年 7 月 29 日
FourCastNet 3 がスケーラブルな幾何学機械学習によって高速かつ高精度な大規模アンサンブル気象予測を可能にする
FourCastNet3 (FCN3) は、NVIDIA Earth-2 による最新の AI グローバル気象予測システムで、中期予報における予測精度は最先端の機械学習モデルに匹敵し、従来の数値予報システムを上回ります。
3 MIN READ
2025 年 7 月 11 日
NVIDIA Earth-2 で 2 週間以降の天気を予報する
気象分野の専門家が確率的な亜季節予報のために大規模アンサンブルを開発および検証する際に活用できる、Earth-2 プラットフォームの各種機能について概要を紹介します。
2 MIN READ
2025 年 2 月 4 日
NVIDIA Spectrum-X ネットワーキング プラットフォームと NVIDIA パートナーが AI ストレージを最大 48% 高速化
帯域幅が増えることで、AI ワークフローにおけるストレージに依存するステップの完了にかかる時間が短縮できるので、トレーニングにおいてはジョブの完了にかかる時間が短縮され、推論においてはトークン間の遅延が減少します。
2 MIN READ
2024 年 11 月 22 日
Hymba ハイブリッド ヘッド アーキテクチャが小規模言語モデルのパフォーマンスを向上
Hymba 1.5B は、同様の規模である最先端のオープンソース モデルと比べ、良好なパフォーマンスを発揮し、同等のサイズの Transformer モデルで比較すると、Hymba はより高いスループットを発揮し、キャッシュを保存するために必要なメモリが 10 分の 1 で済みます。
4 MIN READ
2024 年 11 月 12 日
AI-RAN が通信事業者向けに新しい AI のビジネス チャンスをもたらす
SoftBank が、NVIDIA アクセラレーション ハードウェアと NVIDIA Aerial ソフトウェアを技術基盤として活用し、神奈川県藤沢市で屋外フィールド トライアルを成功させ、AI-RAN ビジョンを現実のものにしました。
4 MIN READ
2024 年 11 月 8 日
NVIDIA TensorRT-LLM の KV Cache Early Reuseで、Time to First Token を 5 倍高速化
KV キャッシュの再利用技術と、TTFT のさらなる高速化を実現するベストプラクティスについて解説します。
2 MIN READ
2024 年 10 月 31 日
NVIDIA NIM によるマルチモーダル ビジュアル AI エージェントの構築
NVIDIA NIM マイクロサービスを使用すれば、高度なビジュアル AI エージェントの構築がこれまで以上に簡単で効率的になります。
3 MIN READ
2024 年 10 月 28 日
LLM のモデル マージのご紹介
複数のカスタマイズされた LLM の重みを組み合わせることで、リソースの利用率を高めるモデル マージの、機能方法、種類、およびモデル マージがどのように繰り返され、進化しているのかについてご紹介します。
2 MIN READ