Pro Tip

2025년 8월 1일
CUDA 활용 팁: 벡터화된 메모리 접근으로 성능 향상하기
CUDA 커널의 성능은 종종 메모리 대역폭에 의해 제한되며, 최신 하드웨어일수록 연산 성능 대비 대역폭이 상대적으로 부족합니다.
4 MIN READ

2022년 8월 12일
CUDA 전문가 팁: 유용한 범용 GPU 프로파일러 nvprof
CUDA 5의 CUDA 툴킷에 nvprof라는 강력한 새 도구가 추가되었습니다. nvprof는 Linux, Windows 및 OS X에서 사용할 수…
4 MIN READ