Rakib Hasan

Rakib Hasan은 NVIDIA의 Senior AI Developer Technology Engineer로, 대규모 언어 모델(LLM) 추론을 포함한 딥러닝 워크로드 최적화에 전문성을 갖추고 있습니다. 그는 Llama 모델 지원과 RoPE 스케일링, Speculative Decoding과 같은 기능을 구현하며 TensorRT-LLM 개발에도 기여했습니다. Rakib은 Louisiana State University(LSU)에서 x64 및 ARM CPU 기반 수학 라이브러리 최적화를 주제로 박사 학위를 취득했습니다.

Posts by Rakib Hasan

Agentic AI / Generative AI

수학 문제 해결 속도를 4배 높이는 추론 가속 전략

거대 언어 모델은 뛰어난 문제 해결 능력을 갖추고 있지만, 실제 서비스 환경에서 빠르고 안정적으로 활용하려면 성능만으로는 부족합니다. 5 MIN READ