정희종

정희종은 SqueezeBits의 머신러닝 엔지니어입니다. 각종 하드웨어에서의 효율적인 연산 수행과 AI 서빙 시스템에 주력하고 있습니다.

Posts by 정희종

Generative AI / LLMs

Ditto in Action: Torch-TensorRT로 손쉽게 LLM 추론 가속하기

Direct Torch to TensorRT-LLM Optimizer, 줄여서 Ditto는 Transformer 모델을 TensorRT 엔진으로… 5 MIN READ