Posts by Alan Gray
Generative AI
2024년 8월 9일
CUDA 그래프로 llama.cpp AI 추론 최적화하기
오픈 소스인 llama.cpp 코드 베이스는 원래 2023년에 출시된 가볍지만 효율적인 프레임워크로서 Meta Llama 모델에 대한 추론을…
5 MIN READ