Benchmark

2026 年 2 月 6 日

NVFP4 が AI のトレーニングと推論を加速する 3 つの方法

NVIDIA による徹底的な共同設計によって、モデルのトレーニングと推論の両方において、優れた精度で大幅なパフォーマンスの向上が達成が見込めるようになりました。

2 MIN READ

2024 年 11 月 8 日

NVIDIA TensorRT-LLM の KV Cache Early Reuseで、Time to First Token を 5 倍高速化

KV キャッシュの再利用技術と、TTFT のさらなる高速化を実現するベストプラクティスについて解説します。

2 MIN READ

2024 年 11 月 6 日

NVIDIA NeMo による最先端のマルチモーダル生成 AI モデル開発

NeMo Curator を使用した大規模なデータ処理と、Cosmos トークナイザーを使用した高品質なトークン化やビジュアル再構築を備えた、NVIDIA NeMo プラットフォームで、最先端のマルチモーダル生成 AI モデルを構築しましょう。

2 MIN READ

2024 年 10 月 28 日

NVIDIA GH200 Superchip が、Llama モデルとのマルチターンインタラクションの推論を 2 倍高速化

NVIDIA GH200 Grace Hopper Superchip を活用し、システムスループットを犠牲にすることなく、x86 ベースの NVIDIA H100 サーバーと比較して、Llama 3 70B モデルでマルチターンでユーザーとのやり取りする場合、TTFT を最大 2 倍に向上させる方法について解説します。

2 MIN READ

2024 年 3 月 20 日

記録を塗り替え続ける NVIDIA cuOpt アルゴリズムがルート最適化ソリューションを 100 倍高速化

最適化アルゴリズムの主要な要素、その定義、業界をリードするソリューションに対して NVIDIA cuOpt のベンチマークを実行するプロセスについて掘り下げ、その比較の重要性に焦点を当ててご紹介します。

3 MIN READ

2024 年 2 月 22 日

NVIDIA Spectrum-X に対する AI ネットワークパフォーマンスのベンチマークを Supermicro が提供

NVIDIA Spectrum-X はハイパースケールクラウドインフラの AI 向けに作られた最先端のネットワーキングプラットフォームとして脚光を浴びています。

2 MIN READ

2023 年 11 月 8 日

RAPIDS cuDF、コード変更ゼロで pandas を約 150 倍高速化

NVIDIA は、RAPIDS cuDF が 950 万人の pandas ユーザーに、コードを変更することなく GPU アクセラレーションを提供できるようになったと発表しました。

2 MIN READ

Benchmark

NVFP4 が AI のトレーニングと推論を加速する 3 つの方法

NVIDIA TensorRT-LLM の KV Cache Early Reuseで、Time to First Token を 5 倍高速化

NVIDIA NeMo による最先端のマルチモーダル生成 AI モデル開発

NVIDIA GH200 Superchip が、Llama モデルとのマルチターン インタラクションの推論を 2 倍高速化

記録を塗り替え続ける NVIDIA cuOpt アルゴリズムがルート最適化ソリューションを 100 倍高速化

NVIDIA Spectrum-X に対する AI ネットワーク パフォーマンスのベンチマークを Supermicro が提供

RAPIDS cuDF、コード変更ゼロで pandas を約 150 倍高速化

NVIDIA GH200 Superchip が、Llama モデルとのマルチターンインタラクションの推論を 2 倍高速化

NVIDIA Spectrum-X に対する AI ネットワークパフォーマンスのベンチマークを Supermicro が提供