Michael Iovine

Michael Iovine는 NVIDIA의 시니어 소프트웨어 엔지니어입니다. 현재 TensorRT-LLM의 추론 최적화 작업을 진행하고 있으며 해당 프레임워크의 추측성 디코딩 모듈 개발을 이끌고 있습니다. 캘리포니아 공과대학교에서 컴퓨터공학 학사 학위를 취득했습니다.

Posts by Michael Iovine

Data Center / Cloud

DFlash 추론 가속 디코딩으로 NVIDIA Blackwell에서 최대 15배 추론 성능 향상하기

AI 시스템이 단일 대화형 상호작용에서 조율된 멀티 에이전트 워크플로우로 진화함에 따라 저지연 추론의 중요성이 더욱 커지고 있습니다. 5 MIN READ