Haohang Huang

Haohang Huang은 NVIDIA의 선임 AI 개발 기술 엔지니어입니다. 그는 컴퓨터 비전과 거대 언어 모델에 중점을 두고 GPU에서 GenAI 애플리케이션을 가속화하는 작업을 하고 있습니다. 그는 일리노이대학교 어바나-샴페인 캠퍼스에서 박사 학위를 받았습니다.

Posts by Haohang Huang

Generative AI

NVIDIA TensorRT-LLM, 인플라이트 배치로 인코더-디코더 모델 가속화

NVIDIA는 최근 NVIDIA TensorRT-LLM이 인코더-디코더 모델 아키텍처를 가속화한다고 발표했습니다. 3 MIN READ