Nick Comly

Nick Comly는 NVIDIA의 딥 러닝 추론 제품 관리자입니다. 그는 TensorRT 추론 최적화의 강력한 성능을 PyTorch, TensorFlow, MXNet, ONNX 및 PaddlePaddle과 같은 프레임워크에 직접 제공하기 위해 노력하고 있습니다. Nick은 스탠포드 대학교에서 딥 러닝과 최적화를 전공하며 석사 학위를 받았습니다.

Posts by Nick Comly

Data Center / Cloud

NVIDIA H200에서 거대 언어 모델 속도 향상을 제공하는 NVIDIA TensorRT-LLM

거대 언어 모델(LLM)은 지난 한 해 동안 급격한 성장을 거듭했습니다. 뛰어난 사용자 경험을 제공하기 위해서는 높은 컴퓨팅 처리량과 대량의… 3 MIN READ
Generative AI

추론 성능 가속화하는 새로운 소프트웨어 TensorRT-LLM 출시

대규모 언어 모델(LLM)의 획기적인 새로운 기능은 AI의 영역을 넓히고 있습니다. 그러나 큰 크기와 특수한 실행 특성으로 비용 효율적인 방식으로… 5 MIN READ