Data Center / Cloud / Edge

2024 年 11 月 21 日
NVIDIA NIM でファインチューニングされた AI モデルのデプロイ
パフォーマンスを最適化した TensorRT-LLM 推論エンジンをローカルでビルドして、SFT でカスタマイズされたモデルに対する NIM マイクロサービスを迅速にデプロイする方法を説明します。
2 MIN READ

2024 年 11 月 4 日
NVIDIA AI Workbench によるハイブリッド環境におけるスムーズなコラボレーションと迅速なプロトタイピング
データ サイエンス、AI、機械学習などのプロジェクトを合理化する無料の開発環境マネージャー「NVIDIA AI Workbench」の、最新リリースでの主要な新機能とユーザーから要望のあった更新についてご紹介します。
3 MIN READ

2024 年 10 月 28 日
NVIDIA GH200 Superchip が、Llama モデルとのマルチターン インタラクションの推論を 2 倍高速化
NVIDIA GH200 Grace Hopper Superchip を活用し、システム スループットを犠牲にすることなく、x86 ベースの NVIDIA H100 サーバーと比較して、Llama 3 70B モデルでマルチターンでユーザーとのやり取りする場合、TTFT を最大 2 倍に向上させる方法について解説します。
2 MIN READ

2024 年 9 月 30 日
NVIDIA NIM Operator で Kubernetes の AI 推論パイプラインを管理
NIM Operator を使用すれば、わずか数回のクリックまたはコマンドで、NVIDIA NIM マイクロサービスのデプロイ、オートスケーリング、ライフサイクルを管理することができます。
2 MIN READ

2024 年 4 月 15 日
本番環境への AI モデルのデプロイを効率化する NVIDIA NIM
NVIDIA AI Enterprise に含まれる NVIDIA NIM は、AI を活用するエンタープライズ アプリの開発と、AI モデルを本番環境にデプロイするための合理化された道のりを提供します。
2 MIN READ

2024 年 3 月 18 日
NVIDIA GB200 NVL72 は兆単位パラメーターの LLM トレーニングとリアルタイム推論を実現
新しい NVIDIA GB200 NVL72 は、計算負荷が高く、リソースを大量に消費する大規模なモデルのトレーニングとデプロイに対応するシステムの 1 つです。
4 MIN READ

2024 年 3 月 18 日
RAG アプリケーションを 4 つのステップでパイロットから本番環境に移行する方法
セキュリティ、サポート、安定性を提供する NVIDIA AI Enterprise は、企業による RAG アプリケーションのパイロットから本番環境への移行を支援します。
3 MIN READ

2024 年 2 月 22 日
NVIDIA Spectrum-X に対する AI ネットワーク パフォーマンスのベンチマークを Supermicro が提供
NVIDIA Spectrum-X はハイパースケール クラウド インフラの AI 向けに作られた最先端のネットワーキング プラットフォームとして脚光を浴びています。
2 MIN READ

2023 年 11 月 15 日
LLM テクニックの習得: LLMOps
この投稿では、生成 AI アプリ開発の概要を説明し、GenAIOps と LLMOps の概念を定義し、それらを MLOps と比較します。
3 MIN READ

2023 年 11 月 15 日
NVIDIA AI Foundation モデル: 本番利用可能な LLM を使用して、企業向けのカスタムチャットボットとコパイロットを構築
大規模言語モデル (LLM) は自然言語理解、AI、機械学習における高度な機能を実現し、データ サイエンスに革命をもたらしています。
3 MIN READ

2023 年 11 月 15 日
Azure Machine Learning 上の NVIDIA AI で企業向け生成 AI アプリ開発を強化
生成 AI は、あらゆる産業において、データを活用して生産性を向上させ、パーソナライズされた顧客エンゲージメントを進め、
2 MIN READ

2023 年 11 月 14 日
ハイパフォーマンス コンピューティングにおけるエネルギー効率: スピードと持続可能性のバランス
コンピューティングの世界は劇的な転換期にあります。 コンピューティング性能、特にハイパフォーマンス コンピューティング (HPC)…
5 MIN READ

2023 年 10 月 2 日
ソフトウェアデファインドな、高性能で効率的な vRAN の構築には、プログラム可能なインラインによる高速化が必要
プログラム可能なインライン アクセラレーションが、高性能でエネルギー効率に優れ、高い拡張性でクラウドネイティブな vRAN を実現するための重要な基盤である理由をご説明します。
4 MIN READ

2023 年 9 月 12 日
実務で使える生成 AI を NVIDIA AI Enterprise 4.0 で実装しビジネスを強化
NVIDIA AI Enterprise 4.0 は、生成 AI でイノベーションを起こそうとしている企業向けに、本番環境に対応したサポート、管理性、セキュリティ、信頼性を提供し、さまざまな側面から開発を加速します。
1 MIN READ

2023 年 8 月 15 日
NVIDIA DOCA GPUNetIO により、強力なリアルタイム ネットワーク処理の実現
ネットワーク トラフィックのリアルタイム処理では、GPU が提供する高度な並列性を活用することができます。この種のアプリケーションでは、
4 MIN READ

2023 年 8 月 8 日
1 兆トークンのデータセットをキュレーション: NVIDIA NeMo Data Curator のご紹介
大規模言語モデル (LLM) スケーリング則における最新の開発では、モデル パラメーターの数をスケーリングする場合、
2 MIN READ