AI Platforms / Deployment

2025년 8월 13일
LLM 추론, AI 에이전트, 및 테스트 시간 스케일링 알아보기
고도화된 AI 모델을 개발하고 배포하려면, 확장 가능하고 효율적인 GPU 인프라가 꼭 필요합니다. 하지만 클라우드 네이티브 환경에서 컨테이너…
4 MIN READ

2025년 8월 6일
NVIDIA, GB200 NVL72로 OpenAI gpt-oss 모델을 클라우드부터 엣지까지 초당 150만 토큰 속도로 가속
NVIDIA와 OpenAI는 2016년 NVIDIA DGX 출시를 시작으로 AI의 한계를 넓혀왔습니다. 이번에는 OpenAI의 gpt-oss…
4 MIN READ

2025년 7월 30일
AI에 안정적인 전력을 제공하는 GB300 NVL72의 새로운 기능
전기 그리드는 조명, 가전제품, 일정한 출력을 유지하는 산업용 기계처럼 비교적 일정한 부하를 처리하도록 설계되어 있습니다.
6 MIN READ

2025년 7월 18일
NVIDIA Dynamo, 비용 효율적인 대규모 추론을 위한 AWS 서비스 지원 추가
이제 AWS의 개발자와 솔루션 아키텍트는 NVIDIA Blackwell 기반 Amazon EC2 P6를 포함한 NVIDIA GPU 기반 Amazon…
3 MIN READ

2025년 7월 4일
NVIDIA Jetson와 RTX에서 Google DeepMind의 Gemma 3n 실행하기
이제 NVIDIA는 RTX 및 Jetson 플랫폼에서 Gemma 3n을 공식 지원합니다. 지난달 Google I/
3 MIN READ

2025년 6월 13일
Alibaba Cloud PAI, 이제 NVIDIA Cosmos Reason-1 원클릭 배포 및 사용 지원
NVIDIA는 최근 멀티모달 거대 언어 모델(MLLM) Cosmos Reason-1을 공개했습니다. 이번에 발표된 모델은 7B와 56B 두 가지…
5 MIN READ

2025년 5월 23일
PCIe Gen6 연결성을 갖춘 NVIDIA ConnectX-8 SuperNIC, AI 플랫폼 아키텍처를 발전시킵니다.
AI 작업이 점점 더 복잡해지고 규모도 커지면서, 거대 언어 모델(LLM)부터 에이전틱 AI, 피지컬 AI에 이르기까지 더 빠르고 확장 가능한…
4 MIN READ

2025년 5월 21일
NVIDIA Dynamo, 대규모 분산 추론 발전을 위한 llm-d 커뮤니티 이니셔티브 가속화
2025년 Red Hat Summit에서 공개된 llm-d 커뮤니티는 오픈소스 생태계에서 생성형 AI 추론 혁신을 가속하는 중요한 진전입니다.
3 MIN READ

2025년 4월 25일
NVIDIA NIM을 사용한 게임용 에이전트 LLM 및 VLM 추론 벤치마킹
런던대학교 유니버시티칼리지(UCL)의 DARK(Dark, Acting, and Reasoning with Knowledge) 연구실은 NVIDIA…
4 MIN READ

2025년 4월 23일
코퍼레이트 벡터를 사용한 NVIDIA OptiX의 뉴럴 렌더링
NVIDIA가 OptiX 9.0을 출시하면서 ‘코퍼러티브 벡터(cooperative vectors)’라는 새로운 기능이 추가됐습니다.
8 MIN READ

2025년 4월 18일
획기적인 추론 정확도를 제공하는 NVIDIA Llama Nemotron Ultra 오픈 모델
AI는 이제 텍스트나 이미지 생성 수준을 넘어, 정교한 추론과 문제 해결, 실제 비즈니스 환경에 유연하게 적용될 수 있는 기술로 발전하고 있습니다.
5 MIN READ

2025년 2월 26일
NVIDIA GPU에서 훈련된 Microsoft Phi SLM에 최신 멀티모달 추가
거대 언어 모델(LLM)은 모든 산업에 스며들어 기술의 잠재력을 변화시켰습니다. 그러나 방대한 크기로 인해 현재 많은 기업이 처한 리소스 제약…
3 MIN READ

2025년 2월 20일
NVIDIA DGX Cloud, AI 플랫폼 성능 벤치마킹을 위한 즉시 사용 가능한 템플릿 출시
AI 시스템과 워크로드가 빠르게 발전하는 환경에서 최적의 모델 학습 성능을 달성하려면 단순히 칩 속도를 높이는 것만으로는 충분하지 않습니다. 컴퓨팅…
4 MIN READ

2025년 1월 24일
차세대 DPU 가속 클라우드 인프라의 물결에 동력을 공급하는 NVIDIA DOCA 플랫폼 프레임워크
생성형 AI, 5G 통신, 소버린 클라우드에 대한 수요가 증가하면서 가속 컴퓨팅으로 전환하는 조직이 늘어나고 있습니다.
5 MIN READ

2025년 1월 22일
새로운 NVIDIA NeMo 프레임워크 기능으로 맞춤형 비디오 파운데이션 모델 파이프라인 가속화
생성형 AI는 텍스트 기반에서 멀티모달 모델로 발전해 왔으며, 최근에는 비디오 영역으로 확장되어 다양한 산업 분야에서 새로운 활용 가능성을 열어가고…
7 MIN READ