Posts by Zhihan Jiang
Data Center / Cloud
2026년 4월 1일
NVIDIA 플랫폼, 극한의 공동 설계로 최저 토큰 비용 구현
NVIDIA Blackwell Ultra GPU가 MLPerf Inference v6.0에서 291회 누적 우승. DeepSeek-R1 Interactive 등 신규 벤치마크 전항목 1위, 소프트웨어 최적화로 6개월 만에 2.7배 성능 향상.
6 MIN READ
Networking
2023년 4월 19일
AI를 위한 풀스택 최적화를 통해 MLPerf 추론 v3.0에서 새로운 기록 수립
현재 가장 주목받는 컴퓨팅 애플리케이션은 복잡한 AI 모델을 학습하고 추론을 실행하는 데 의존하고 있으며, 종종 까다로운 실시간 배포 시나리오에서…
9 MIN READ