LLM Benchmarking
2025년 10월 31일
고강도 AI 작업을 가능하게 하는 NVIDIA DGX Spark 성능
오늘날 AI 개발 워크로드는 데스크톱 시스템의 메모리 한계를 넘어서거나, 노트북이나 PC에서는 실행하기 어려운 소프트웨어를 필요로 하는 경우가…
3 MIN READ
2025년 8월 29일
QAT로 정확도와 성능을 높이는 gpt-oss 파인튜닝
대규모 오픈소스 파운데이션 모델 공개는 AI 커뮤니티에 늘 큰 기대를 불러일으킵니다. 새로운 아키텍처적 혁신과 기능이 함께 등장하기 때문입니다.
5 MIN READ
2025년 8월 8일
LLM 추론 벤치마크: TensorRT-LLM을 활용한 성능 튜닝
이 글은 TensorRT-LLM으로 LLM 추론 성능을 벤치마킹하고 최적화하는 방법을 소개하는 시리즈의 세 번째 편입니다.
6 MIN READ
2025년 4월 25일
NVIDIA NIM을 사용한 게임용 에이전트 LLM 및 VLM 추론 벤치마킹
런던대학교 유니버시티칼리지(UCL)의 DARK(Dark, Acting, and Reasoning with Knowledge) 연구실은 NVIDIA…
4 MIN READ