Posts by Farshad Ghodsian
Data Center / Cloud
2026년 4월 3일
NVIDIA Groq 3 LPX 심층 분석: Vera Rubin 플랫폼을 위한 저지연 추론 가속기
NVIDIA Groq 3 LPX, Vera Rubin 플랫폼 전용 랙 규모 저지연 추론 가속기. 315 PFLOPS·128 GB SRAM과 AFD 아키텍처로 GB200 NVL72 대비 35배 높은 TPS/MW와 10배 수익 기회를 실현합니다. LPU 아키텍처와 NVIDIA Dynamo 오케스트레이션을 살펴보세요.
12 MIN READ
Agentic AI / Generative AI
2025년 10월 10일
NVIDIA Blackwell, SemiAnalysis InferenceMAX™ v1 벤치마크에서 놀라운 기록을 세우다
SemiAnalysis가 최근 발표한 InferenceMAX™ v1은 추론 하드웨어 성능을 평가하기 위한 포괄적인 방법론을 제공하는 새로운 오픈…
7 MIN READ
Generative AI
2025년 9월 25일
NVFP4, 16비트 정밀도와 4비트 성능으로 학습 가속
최근 몇 년간 AI 워크로드는 폭발적으로 증가했습니다. 이는 거대 언어 모델(LLM)의 배포는 물론, 사전 학습과 후속 학습 과정에서 점점 더 많은…
6 MIN READ