Posts by Kyle Kranen
Development & Optimization
2025년 5월 14일
추론형 AI 모델을 위한 저지연 분산 추론 프레임워크, NVIDIA Dynamo 출시
NVIDIA는 GTC 2025에서 고처리량, 저지연 오픈소스 추론 프레임워크인 NVIDIA Dynamo의 출시를 발표했습니다.
9 MIN READ
Generative AI / LLMs
2024년 3월 15일
LLM 아키텍처에 Mixture of Experts(MoE)를 활용하기
Mixture of Experts(MoE) 거대 언어 모델(LLM) 아키텍처는 최근 GPT-4와 같은 독점 LLM은 물론 Mixtral 8x7B의…
7 MIN READ