Fernando Xiong

Fernando Xiong는 NVIDIA 컴퓨트 아키텍처 그룹의 시니어 아키텍트입니다. 추측성 디코딩, LLM 추론을 위한 성능 최적화, 그리고 소프트웨어 엔지니어링을 위한 AI 에이전트 시스템에 집중하고 있습니다. 중국 인민대학교에서 컴퓨터공학 석사 학위를 받았습니다.

Posts by Fernando Xiong

Data Center / Cloud

DFlash 추론 가속 디코딩으로 NVIDIA Blackwell에서 최대 15배 추론 성능 향상하기

AI 시스템이 단일 대화형 상호작용에서 조율된 멀티 에이전트 워크플로우로 진화함에 따라 저지연 추론의 중요성이 더욱 커지고 있습니다. 5 MIN READ