Generative AI

2026년 2월 9일

엔터프라이즈 LLM 서빙을 위한 NeMo Microservices 아키텍처

LLM을 실제 서비스 환경에 적용해 운영하다 보면, 시간이 지날수록 체감 성능이 서서히 저하되는 현상을 피하기 어렵습니다.

13 MIN READ

2025년 10월 10일

NVIDIA Blackwell, SemiAnalysis InferenceMAX™ v1 벤치마크에서 놀라운 기록을 세우다

SemiAnalysis가 최근 발표한 InferenceMAX™ v1은 추론 하드웨어 성능을 평가하기 위한 포괄적인 방법론을 제공하는 새로운 오픈…

7 MIN READ

2025년 9월 19일

AI 추론 지연 시간을 줄이기 위한 Speculative Decoding 소개

거대 언어 모델(LLM)로 텍스트를 생성할 때는 구조적인 한계로 인해 성능을 제대로 끌어내기 어려운 경우가 많습니다. GPU는 뛰어난 연산 성능을…

7 MIN READ

2025년 7월 23일

Google Cloud & NVIDIA 개발자 커뮤니티에 지금 함께하세요.

구글 클라우드와 NVIDIA는 개발자를 위한 새로운 커뮤니티를 함께 만들고 있습니다. 이곳에서는 두 회사의 핵심 기술을 바탕으로 혁신적인 솔루션을…

1 MIN READ

2025년 7월 1일

맞춤형 정보 검색을 위한 임베딩 모델 정확도 향상

도메인 특화 데이터(법률 문서, 의료 기록, 여러 차례의 대화가 오가는 고객 상담 등)를 다룰 때는, 정보 검색의 효율성을 높이기 위해 임베딩…

5 MIN READ

2025년 6월 13일

Alibaba Cloud PAI, 이제 NVIDIA Cosmos Reason-1 원클릭 배포 및 사용 지원

NVIDIA는 최근 멀티모달 거대 언어 모델(MLLM) Cosmos Reason-1을 공개했습니다. 이번에 발표된 모델은 7B와 56B 두 가지…

5 MIN READ

2025년 5월 21일

NVIDIA Dynamo, 대규모 분산 추론 발전을 위한 llm-d 커뮤니티 이니셔티브 가속화

2025년 Red Hat Summit에서 공개된 llm-d 커뮤니티는 오픈소스 생태계에서 생성형 AI 추론 혁신을 가속하는 중요한 진전입니다.

3 MIN READ

2025년 5월 16일

배터리 연구 가속화를 위한 추론 기능을 갖춘 전문 LLM 적용

복잡한 배터리 혁신 분야와 같은 과학 연구는 종종 소재를 수작업으로 평가하는 방식에 의존해 하루에 수십 개의 후보만 검토할 수 있어 연구 속도가…

7 MIN READ

2025년 5월 16일

3DGUT으로 신경 재구성 및 렌더링을 혁신하는 gsplat

현실감 있는 3D 시뮬레이션은 자율주행차 훈련부터 로보틱스, 디지털 트윈에 이르기까지 최신 AI와 그래픽 분야의 핵심 기술로 자리잡고 있습니다.

3 MIN READ

2025년 5월 15일

NVIDIA 풀스택 솔루션을 통한 AI 추론 성능 최적화

2025년 3월 18일부로 NVIDIA Triton Inference Server는 이제 NVIDIA Dynamo로 명칭이 변경되었습니다.

5 MIN READ

2025년 4월 2일

비용 효율적인 LLM 라우팅을 위한 NVIDIA AI Blueprint 배포하기

2022년 11월 ChatGPT가 출시된 이후, 거대 언어 모델(LLM)의 성능은 급격히 향상되었고, 사용 가능한 모델 수도 기하급수적으로…

4 MIN READ

2025년 3월 12일

Spotlight: NVIDIA TensorRT-LLM을 활용한 NAVER Place의 SLM Vertical Service 운영 최적화

NAVER Place에서는 Place 영역에 특화된 SLM Vertical Service를 운영하여 플레이스 프로덕트 전반(플레이스, 지도…

7 MIN READ

2025년 2월 26일

NVIDIA GPU에서 훈련된 Microsoft Phi SLM에 최신 멀티모달 추가

거대 언어 모델(LLM)은 모든 산업에 스며들어 기술의 잠재력을 변화시켰습니다. 그러나 방대한 크기로 인해 현재 많은 기업이 처한 리소스 제약…

3 MIN READ

2024년 12월 20일

NVIDIA Jetson Orin Nano 개발자 키트, “슈퍼” 부스트

Jetson Orin Nano 개발자 키트는 소프트웨어 업데이트만으로 Jetson Orin Nano Super 개발자 키트로 업그레이드할 수 있습니다.

7 MIN READ

2024년 11월 27일

NVIDIA NIM으로 첫번째 휴먼 인더 루프 AI 에이전트 구축하기

거대 언어 모델(LLM)로 구동되는 AI 에이전트는 조직이 반복적인 수작업을 간소화하고 업무량을 줄이는 데 큰 도움을 줍니다.

7 MIN READ

2024년 11월 22일

MLPerf Training v4.1에서 LLM 트레이닝 성능을 두 배로 향상시킨 NVIDIA Blackwell

모델이 커지고 더 많은 데이터로 학습되면서 기능이 늘어나고 활용도도 높아지고 있습니다. 이런 모델을 빠르게 훈련하려면 데이터센터 수준의 높은 성능이…

5 MIN READ