Yilin Fan

Yilin Fan은 NVIDIA의 선임 딥 러닝 엔지니어로 TensorRT/TensorRT-LLM 성능을 전문으로 합니다. 그는 딥 러닝 추론 가속화에 대한 전반적인 관심을 가지고 있습니다. NVIDIA에 합류하기 전에는 Pony.ai에서 자율 주행 차량에 대한 DL 모델의 최적화 및 배포를 담당했습니다. Yilin은 카네기 멜론 대학에서 소프트웨어 공학 석사 학위를, 베이징의 베이항 대학에서 학사 학위를 취득했습니다.

Posts by Yilin Fan

Data Center / Cloud

Blackwell, Meta의 Llama 4 Maverick을 활용해 사용자당 1,000 TPS 장벽 돌파

NVIDIA가 세계 최고 속도의 거대 언어 모델(LLM) 추론 성능을 달성했습니다. NVIDIA Blackwell GPU 8개를 탑재한 단일… 6 MIN READ