이창준

이창준은 SqueezeBits의 머신러닝 엔지니어입니다. 현재 다양한 하드웨어에서의 연산 및 시스템 최적화 관련 업무를 수행하고 있습니다. 이전에는 NVIDIA GPU 환경에서 연산 및 추론 최적화 업무를 담당했습니다.

Posts by 이창준

Generative AI / LLMs

Ditto in Action: Torch-TensorRT로 손쉽게 LLM 추론 가속하기

Direct Torch to TensorRT-LLM Optimizer, 줄여서 Ditto는 Transformer 모델을 TensorRT 엔진으로… 5 MIN READ