Consumer Internet

2024 年 6 月 7 日

LoRA の概要と、LoRA でファインチューニングされたモデルをデプロイする 2 つの方法、また LoRA アダプター群のヘテロジニアスな LoRA デプロイを可能にして、混合バッチ推論リクエストを可能にするためのアプローチについても説明します。

3 MIN READ

2024 年 4 月 2 日

LLM のトレーニングコストを抑え、そのパワーを活用可能なファインチューニングの手法の 1 つである、Low-Rank Adaptation (LoRA) の洞察力と実装について説明し、その応用と利点の一部をご紹介します。

7 MIN READ

2024 年 3 月 14 日

Mixture of Experts (MoE) 大規模言語モデル (LLM) アーキテクチャは、GPT-4 などの商用の LLM と…

4 MIN READ

2023 年 11 月 17 日

LLM 推論における最も差し迫った課題と、いくつかの実用的な解決策について説明します。

6 MIN READ

2023 年 11 月 16 日

Transformer ネットワークを使用して構築された LLM の背後にある基本原則を、モデルアーキテクチャ、アテンションメカニズム、埋め込み手法、基盤モデルのトレーニング戦略にわたり説明します。

3 MIN READ

2023 年 11 月 7 日

大規模言語モデル (LLM: Large :Language Models) とは、数千億のパラメーターを持つインターネット規模のデータセットで学習されるディープラーニングのアルゴリズムです。

3 MIN READ

2023 年 10 月 19 日

NVIDIA は、NVIDIA GPU 上の最新の LLMの推論性能を高速化および最適化する TensorRT-LLM の一般提供を発表しました。

3 MIN READ