NVIDIA 技術ブログ
-
RoboticsNVIDIA Isaac Lab と Newton で四足歩行の移動ポリシーをトレーニングし、布の操作をシミュレートする
-
Generative AINVIDIA NIM により Stockmark 100B 日本語フルスクラッチ LLM が 2.5 倍高速化
-
Generative AIOpenRouter で NVIDIA Nemotron を使用してレポート生成 AI エージェントを構築する
-
Generative AINVIDIA Rubin CPX により、トークン コンテキストが 100 万を超えるワークロードの推論性能と効率が向上
-
Data Center / Cloud / EdgeNVIDIA ARC-Compact を活用して、セル サイトに AI-RAN を展開
最近の投稿

2025 年 9 月 29 日
NVIDIA Isaac Lab と Newton で四足歩行の移動ポリシーをトレーニングし、布の操作をシミュレートする
物理演算はロボティクス シミュレーションで重要な役割を果たし、
3 MIN READ

2025 年 9 月 25 日
NVIDIA NIM により Stockmark 100B 日本語フルスクラッチ LLM が 2.5 倍高速化
最適化コンテナーとして即時に API 化できる NIM は、大規模 LLM 導入時のさまざまな課題を解決します。NIM 対応した日本発の「Stockmark-2-100B-Instruct」を是非お試しください。業務利用に適した高精度な日本語 LLM がすぐに活用可能です。
1 MIN READ

2025 年 9 月 15 日
OpenRouter で NVIDIA Nemotron を使用してレポート生成 AI エージェントを構築する
AI エージェントを構築する上で重要な、基本的な概念から複雑なエージェント型システム実装までステップバイステップでご紹介します。
6 MIN READ

2025 年 9 月 9 日
NVIDIA Rubin CPX により、トークン コンテキストが 100 万を超えるワークロードの推論性能と効率が向上
NVIDIA Blackwell や NVIDIA GB200 NVL72 などのプラットフォームと、低精度推論用の NVFP4 や NVIDIA TensorRT-LLM や NVIDIA Dynamo などのオープンソース ソフトウェアを組み合わせることで、AI 全体の推論性能を再定義します。
2 MIN READ

2025 年 8 月 29 日
NeMo Curator を使った日本語データのキュレーション - モデルベース編
NeMo Curator を使用したモデルベースのテキスト データの品質を簡単に向上するアプローチを、ステップバイステップでご紹介します。
4 MIN READ

2025 年 6 月 13 日
Alibaba Cloud PAI が NVIDIA Cosmos Reason-1 を提供
Alibaba Cloud PAI (AI プラットフォーム) に Cosmos Reason-1-7B を迅速にデプロイし、使用する方法を探ります。
2 MIN READ

2025 年 6 月 11 日
NVIDIA Data Flywheel Blueprint を使用したモデル蒸留で効率的な AI エージェントを構築する
仕組み、エージェントのツール呼び出しを中心とした実際の用途への適用方法、そして自社のエージェント型 AI ワークフロー用のデータ フライホイールを簡単に構築するための設定方法について、詳しく解説します。
3 MIN READ

2025 年 6 月 11 日
オープンソースの AI-Q NVIDIA Blueprint を通じてエンタープライズ データを用いてチャットする
社内ナレッジの活用を促進する AI-Q NVIDIA Blueprint の機能とコンポーネントについて、ユース ケースの例とともに説明します。
2 MIN READ
おすすめ

2025 年 2 月 4 日
NVIDIA Spectrum-X ネットワーキング プラットフォームと NVIDIA パートナーが AI ストレージを最大 48% 高速化
帯域幅が増えることで、AI ワークフローにおけるストレージに依存するステップの完了にかかる時間が短縮できるので、トレーニングにおいてはジョブの完了にかかる時間が短縮され、推論においてはトークン間の遅延が減少します。
2 MIN READ

2024 年 11 月 22 日
Hymba ハイブリッド ヘッド アーキテクチャが小規模言語モデルのパフォーマンスを向上
Hymba 1.5B は、同様の規模である最先端のオープンソース モデルと比べ、良好なパフォーマンスを発揮し、同等のサイズの Transformer モデルで比較すると、Hymba はより高いスループットを発揮し、キャッシュを保存するために必要なメモリが 10 分の 1 で済みます。
4 MIN READ

2024 年 11 月 12 日
AI-RAN が通信事業者向けに新しい AI のビジネス チャンスをもたらす
SoftBank が、NVIDIA アクセラレーション ハードウェアと NVIDIA Aerial ソフトウェアを技術基盤として活用し、神奈川県藤沢市で屋外フィールド トライアルを成功させ、AI-RAN ビジョンを現実のものにしました。
4 MIN READ

2024 年 11 月 8 日
NVIDIA TensorRT-LLM の KV Cache Early Reuseで、Time to First Token を 5 倍高速化
KV キャッシュの再利用技術と、TTFT のさらなる高速化を実現するベストプラクティスについて解説します。
2 MIN READ

2024 年 10 月 31 日
NVIDIA NIM によるマルチモーダル ビジュアル AI エージェントの構築
NVIDIA NIM マイクロサービスを使用すれば、高度なビジュアル AI エージェントの構築がこれまで以上に簡単で効率的になります。
3 MIN READ

2024 年 10 月 28 日
LLM のモデル マージのご紹介
複数のカスタマイズされた LLM の重みを組み合わせることで、リソースの利用率を高めるモデル マージの、機能方法、種類、およびモデル マージがどのように繰り返され、進化しているのかについてご紹介します。
2 MIN READ

2024 年 10 月 8 日
通信会社に AI-RAN を提供
NVIDIA は、同じコンピューティング インフラストラクチャを使用して AI サービスと無線アクセス ネットワーク (RAN) サービスの処理が可能な AI-RAN の展開プラットフォームである Aerial RAN Computer-1 を導入しています。
5 MIN READ

2024 年 10 月 8 日
NVIDIA cuOpt で大規模な線形計画問題を加速する
NVIDIA cuOpt は現在、GPU アクセラレーションで PDLP を実装しています。最先端のアルゴリズム、NVIDIA ハードウェア、専用の CUDA 機能、NVIDIA GPU ライブラリを使用して、cuOpt LP ソルバーは、CPU ベースのソルバーと比較して 5,000 倍以上の高速パフォーマンスを実現しています。
3 MIN READ