김민규

김민규는 SqueezeBits의 머신러닝 엔지니어로 추론 최적화, 머신러닝 컴파일러, 서빙 프레임워크 관련 업무를 수행하고 있습니다. GPU 외의 다양한 NPU에서의 최적화 경험을 보유하고 있습니다.

Posts by 김민규

Generative AI / LLMs

Ditto in Action: Torch-TensorRT로 손쉽게 LLM 추론 가속하기

Direct Torch to TensorRT-LLM Optimizer, 줄여서 Ditto는 Transformer 모델을 TensorRT 엔진으로… 5 MIN READ