Generative AI

2025년 7월 23일
Google Cloud & NVIDIA 개발자 커뮤니티에 지금 함께하세요.
구글 클라우드와 NVIDIA는 개발자를 위한 새로운 커뮤니티를 함께 만들고 있습니다. 이곳에서는 두 회사의 핵심 기술을 바탕으로 혁신적인 솔루션을…
1 MIN READ

2025년 7월 1일
맞춤형 정보 검색을 위한 임베딩 모델 정확도 향상
도메인 특화 데이터(법률 문서, 의료 기록, 여러 차례의 대화가 오가는 고객 상담 등)를 다룰 때는, 정보 검색의 효율성을 높이기 위해 임베딩…
5 MIN READ

2025년 6월 13일
Alibaba Cloud PAI, 이제 NVIDIA Cosmos Reason-1 원클릭 배포 및 사용 지원
NVIDIA는 최근 멀티모달 거대 언어 모델(MLLM) Cosmos Reason-1을 공개했습니다. 이번에 발표된 모델은 7B와 56B 두 가지…
5 MIN READ

2025년 5월 21일
NVIDIA Dynamo, 대규모 분산 추론 발전을 위한 llm-d 커뮤니티 이니셔티브 가속화
2025년 Red Hat Summit에서 공개된 llm-d 커뮤니티는 오픈소스 생태계에서 생성형 AI 추론 혁신을 가속하는 중요한 진전입니다.
3 MIN READ

2025년 5월 16일
배터리 연구 가속화를 위한 추론 기능을 갖춘 전문 LLM 적용
복잡한 배터리 혁신 분야와 같은 과학 연구는 종종 소재를 수작업으로 평가하는 방식에 의존해 하루에 수십 개의 후보만 검토할 수 있어 연구 속도가…
7 MIN READ

2025년 5월 16일
3DGUT으로 신경 재구성 및 렌더링을 혁신하는 gsplat
현실감 있는 3D 시뮬레이션은 자율주행차 훈련부터 로보틱스, 디지털 트윈에 이르기까지 최신 AI와 그래픽 분야의 핵심 기술로 자리잡고 있습니다.
3 MIN READ

2025년 5월 15일
NVIDIA 풀스택 솔루션을 통한 AI 추론 성능 최적화
2025년 3월 18일부로 NVIDIA Triton Inference Server는 이제 NVIDIA Dynamo로 명칭이 변경되었습니다.
5 MIN READ

2025년 4월 2일
비용 효율적인 LLM 라우팅을 위한 NVIDIA AI Blueprint 배포하기
2022년 11월 ChatGPT가 출시된 이후, 거대 언어 모델(LLM)의 성능은 급격히 향상되었고, 사용 가능한 모델 수도 기하급수적으로…
4 MIN READ

2025년 3월 12일
Spotlight: NVIDIA TensorRT-LLM을 활용한 NAVER Place의 SLM Vertical Service 운영 최적화
NAVER Place에서는 Place 영역에 특화된 SLM Vertical Service를 운영하여 플레이스 프로덕트 전반(플레이스, 지도…
7 MIN READ

2025년 2월 26일
NVIDIA GPU에서 훈련된 Microsoft Phi SLM에 최신 멀티모달 추가
거대 언어 모델(LLM)은 모든 산업에 스며들어 기술의 잠재력을 변화시켰습니다. 그러나 방대한 크기로 인해 현재 많은 기업이 처한 리소스 제약…
3 MIN READ

2024년 12월 20일
NVIDIA Jetson Orin Nano 개발자 키트, “슈퍼” 부스트
Jetson Orin Nano 개발자 키트는 소프트웨어 업데이트만으로 Jetson Orin Nano Super 개발자 키트로 업그레이드할 수 있습니다.
7 MIN READ

2024년 11월 27일
NVIDIA NIM으로 첫번째 휴먼 인더 루프 AI 에이전트 구축하기
거대 언어 모델(LLM)로 구동되는 AI 에이전트는 조직이 반복적인 수작업을 간소화하고 업무량을 줄이는 데 큰 도움을 줍니다.
7 MIN READ

2024년 11월 22일
MLPerf Training v4.1에서 LLM 트레이닝 성능을 두 배로 향상시킨 NVIDIA Blackwell
모델이 커지고 더 많은 데이터로 학습되면서 기능이 늘어나고 활용도도 높아지고 있습니다. 이런 모델을 빠르게 훈련하려면 데이터센터 수준의 높은 성능이…
5 MIN READ

2024년 11월 20일
NVIDIA AI Enterprise를 통한 보안 강화 및 AI 에이전트 배포 간소화
AI 에이전트는 조직이 효율성을 높이고 생산성을 개선하며 혁신 속도를 높이는 새로운 방식으로 주목받고 있습니다. 이 에이전트들은 자율적으로 작업을…
4 MIN READ

2024년 8월 28일
파인 튜닝을 위한 LoRA의 강력한 대안, DoRA 살펴보기
전체 파인 튜닝(FT)은 일반적으로 특정 다운스트림 작업에 맞게 미리 학습된 일반 모델을 조정하는 데 사용됩니다. 학습 비용을 줄이기 위해 최소한의…
4 MIN READ

2024년 8월 23일
LLM 추론 크기 조정 및 성능 최적화를 위한 실용적인 전략
챗봇, 콘텐츠 제작 등 다양한 애플리케이션에서 거대 언어 모델(LLM)의 사용이 증가함에 따라 추론 시스템을 확장하고 최적화하는 과정을 이해하여…
1 MIN READ