Hardware / Semiconductor
2024 年 6 月 7 日
NVIDIA NIM で LoRA アダプター群をシームレスにデプロイ
LoRA の概要と、LoRA でファインチューニングされたモデルをデプロイする 2 つの方法、また LoRA アダプター群のヘテロジニアスな LoRA デプロイを可能にして、混合バッチ推論リクエストを可能にするためのアプローチについても説明します。
3 MIN READ
2024 年 3 月 14 日
LLM アーキテクチャにおける Mixture of Experts の適用
Mixture of Experts (MoE) 大規模言語モデル (LLM) アーキテクチャは、GPT-4 などの商用の LLM と…
4 MIN READ
2024 年 2 月 22 日
NVIDIA Spectrum-X に対する AI ネットワーク パフォーマンスのベンチマークを Supermicro が提供
NVIDIA Spectrum-X はハイパースケール クラウド インフラの AI 向けに作られた最先端のネットワーキング プラットフォームとして脚光を浴びています。
2 MIN READ
2023 年 7 月 6 日
NVIDIA CUDA Toolkit 12.2 がアプリケーションを強化する強力な機能をリリース
CUDA Toolkit の最新リリースでは、アクセラレーテッド コンピューティング アプリケーションの基盤を構築する CUDA アプリケーションの強化に不可欠な新機能が取り入れられています。
2 MIN READ