Posts by Ashraf Eassa
Data Center / Cloud
2026년 2월 23일
NVFP4가 AI 훈련과 추론 성능을 가속하는 3가지 방법
최신 AI 모델의 규모와 복잡성이 지속적으로 증가하면서 훈련과 추론에 필요한 컴퓨팅 성능 또한 급격히 증가하고 있습니다. 무어의 법칙으로는 더 이상…
4 MIN READ
Agentic AI / Generative AI
2026년 1월 14일
NVIDIA Blackwell 기반 MoE 추론 성능의 획기적 도약
AI 모델이 점점 더 똑똑해짐에 따라, 사용자들이 AI를 활용하는 업무의 범위도 비약적으로 넓어지고 있습니다. 일반 소비자부터 기업에 이르기까지…
4 MIN READ
AI Platforms / Deployment
2025년 8월 6일
NVIDIA, GB200 NVL72로 OpenAI gpt-oss 모델을 클라우드부터 엣지까지 초당 150만 토큰 속도로 가속
NVIDIA와 OpenAI는 2016년 NVIDIA DGX 출시를 시작으로 AI의 한계를 넓혀왔습니다. 이번에는 OpenAI의 gpt-oss…
4 MIN READ
Generative AI / LLMs
2025년 5월 28일
NVIDIA Blackwell 플랫폼 DeepSeek-R1 추론 성능에서 세계 기록 달성
NVIDIA는 NVIDIA GTC 2025에서 DeepSeek-R1 추론 성능 세계 기록을 발표했습니다.
9 MIN READ
NVIDIA 풀스택 솔루션을 통한 AI 추론 성능 최적화
2025년 3월 18일부로 NVIDIA Triton Inference Server는 이제 NVIDIA Dynamo로 명칭이 변경되었습니다.
5 MIN READ
Data Center / Cloud
2024년 11월 22일
MLPerf Training v4.1에서 LLM 트레이닝 성능을 두 배로 향상시킨 NVIDIA Blackwell
모델이 커지고 더 많은 데이터로 학습되면서 기능이 늘어나고 활용도도 높아지고 있습니다. 이런 모델을 빠르게 훈련하려면 데이터센터 수준의 높은 성능이…
5 MIN READ