DEVELOPER
ホーム
ブログ
フォーラム
ドキュメント
ダウンロード
トレーニング
Search
Join
Architecture / Engineering / Construction
2024 年 6 月 7 日
NVIDIA NIM で LoRA アダプター群をシームレスにデプロイ
LoRA の概要と、LoRA でファインチューニングされたモデルをデプロイする 2 つの方法、また LoRA アダプター群のヘテロジニアスな LoRA デプロイを可能にして、混合バッチ推論リクエストを可能にするためのアプローチについても説明します。
3 MIN READ
NVIDIA NIM で LoRA アダプター群をシームレスにデプロイ
2024 年 3 月 14 日
LLM アーキテクチャにおける Mixture of Experts の適用
Mixture of Experts (MoE) 大規模言語モデル (LLM) アーキテクチャは、GPT-4 などの商用の LLM と…
4 MIN READ
LLM アーキテクチャにおける Mixture of Experts の適用
詳細を見る