Benjamin Chislett

Benjamin Chislett는 NVIDIA의 시니어 소프트웨어 엔지니어이자 vLLM 추론 엔진의 메인테이너입니다. 그는 추측성 디코딩 알고리즘과 LLM 추론의 성능 최적화 연구를 진행하고 있습니다.

Posts by Benjamin Chislett

Data Center / Cloud

DFlash 추론 가속 디코딩으로 NVIDIA Blackwell에서 최대 15배 추론 성능 향상하기

AI 시스템이 단일 대화형 상호작용에서 조율된 멀티 에이전트 워크플로우로 진화함에 따라 저지연 추론의 중요성이 더욱 커지고 있습니다. 5 MIN READ