Pradeep Ramani

Pradeep Ramani는 NVIDIA의 선임 딥 러닝 아키텍트로서 GPU에서 광선형 대수 연산 속도를 위한 추상화 설계를 담당하고 있습니다. Pradeep은 하드웨어 설계, 아키텍처, 프로그래밍 모델, 라이브러리 설계(CUTLASS) 등 GPU 스택의 여러 계층에서 14년 이상의 경력을 쌓았습니다. 그는 캘리포니아대학교 산타바바라 캠퍼스에서 전기 및 컴퓨터 공학 석사 학위를 받았습니다.

Posts by Pradeep Ramani

Data Center / Cloud

OpenAI Triton, NVIDIA Blackwell에서 AI 성능 및 프로그래머블성 향상

행렬 곱셈과 어텐션 메커니즘은 현대 AI 워크로드의 연산적 기반입니다. NVIDIA cuDNN과 같은 라이브러리는 고도로 최적화된 구현을 제공하며… 3 MIN READ