Posts by Ryan Olson
Agentic AI / Generative AI
2026년 5월 27일
DynoSim: 파레토 프런티어를 시뮬레이션하다
오늘날의 LLM 서빙은 튜닝하기가 까다롭습니다. 배포마다 모델 백엔드, 텐서 병렬(TP) 형태, 프리필/디코드 분할, 워커 수, 스케줄러 설정…
8 MIN READ
Development & Optimization
2025년 5월 14일
추론형 AI 모델을 위한 저지연 분산 추론 프레임워크, NVIDIA Dynamo 출시
NVIDIA는 GTC 2025에서 고처리량, 저지연 오픈소스 추론 프레임워크인 NVIDIA Dynamo의 출시를 발표했습니다.
9 MIN READ