LLMs

2025년 4월 2일
비용 효율적인 LLM 라우팅을 위한 NVIDIA AI Blueprint 배포하기
2022년 11월 ChatGPT가 출시된 이후, 거대 언어 모델(LLM)의 성능은 급격히 향상되었고, 사용 가능한 모델 수도 기하급수적으로…
4 MIN READ

2025년 3월 12일
Spotlight: NVIDIA TensorRT-LLM을 활용한 NAVER Place의 SLM Vertical Service 운영 최적화
NAVER Place에서는 Place 영역에 특화된 SLM Vertical Service를 운영하여 플레이스 프로덕트 전반(플레이스, 지도…
7 MIN READ

2025년 2월 28일
LLM을 위한 NVIDIA NIM 마이크로서비스로 과학 문헌 검토 가속화
과학 연구자들은 종종 연구 초기에 잘 정리된 체계적인 리뷰를 접합니다. 처음 이 분야를 접하는 과학자에게는 개념을 쉽게 정리할 수 있는 구조화된…
4 MIN READ

2025년 2월 20일
NVIDIA DGX Cloud, AI 플랫폼 성능 벤치마킹을 위한 즉시 사용 가능한 템플릿 출시
AI 시스템과 워크로드가 빠르게 발전하는 환경에서 최적의 모델 학습 성능을 달성하려면 단순히 칩 속도를 높이는 것만으로는 충분하지 않습니다. 컴퓨팅…
4 MIN READ

2025년 2월 6일
AI 스토리지를 최대 48% 가속화하는 NVIDIA Spectrum-X 네트워킹 플랫폼
AI 팩토리는 단순히 컴퓨팅 패브릭에 의존하지 않습니다. GPU를 연결하는 동서 네트워크가 AI 애플리케이션 성능에 매우 중요한 것처럼…
4 MIN READ

2025년 1월 17일
Nemotron-CC를 소개합니다: LLM 사전 학습을 위한 1조 토큰 규모의 영어 데이터 세트 공개
NVIDIA는 1조 9천억 개의 합성 생성 데이터를 포함하여 매우 정확한 거대 언어 모델(LLM)의 사전 학습을 위한 6조 3천억 개의 토큰으로…
3 MIN READ

2024년 12월 20일
NVIDIA Jetson Orin Nano 개발자 키트, “슈퍼” 부스트
Jetson Orin Nano 개발자 키트는 소프트웨어 업데이트만으로 Jetson Orin Nano Super 개발자 키트로 업그레이드할 수 있습니다.
7 MIN READ

2024년 11월 29일
Hymba 하이브리드 헤드 아키텍처로 소규모 언어 모델 성능 향상
어텐션 기반 아키텍처를 갖춘 트랜스포머는 강력한 성능, 병렬 처리, 키-값(KV) 캐시를 활용한 장기 기억 능력 덕분에 언어 모델(LM)로서 가장…
8 MIN READ

2024년 11월 27일
NVIDIA NIM으로 첫번째 휴먼 인더 루프 AI 에이전트 구축하기
거대 언어 모델(LLM)로 구동되는 AI 에이전트는 조직이 반복적인 수작업을 간소화하고 업무량을 줄이는 데 큰 도움을 줍니다.
7 MIN READ

2024년 11월 22일
MLPerf Training v4.1에서 LLM 트레이닝 성능을 두 배로 향상시킨 NVIDIA Blackwell
모델이 커지고 더 많은 데이터로 학습되면서 기능이 늘어나고 활용도도 높아지고 있습니다. 이런 모델을 빠르게 훈련하려면 데이터센터 수준의 높은 성능이…
5 MIN READ

2024년 11월 15일
NVIDIA AI Blueprint로 비디오 검색 및 요약 에이전트 구축하기
이 게시물은 2024년 7월 29일에 처음 게시되었으나, 이후 NVIDIA AI Blueprint 정보를 바탕으로 수정되었습니다.
6 MIN READ

2024년 10월 30일
추론 속도를 2배 높인 NVIDIA GH200 슈퍼칩, Llama 모델과의 멀티턴 상호작용에서 추론 가속화
프로덕션 환경에 거대 언어 모델(LLM)을 배포하려면 사용자 상호 작용을 향상시키는 것과 시스템 처리량을 늘리는 것 사이에서 어려운 절충점을 찾아야…
4 MIN READ

2024년 10월 25일
NVIDIA NeMo Curator로 처리된 Zyda-2 오픈 5T 토큰 데이터 세트로 정확도 높은 LLM 훈련하기
오픈 소스 데이터 세트는 고품질 데이터에 대한 액세스를 크게 대중화하여 개발자와 연구자들이 최첨단 생성형 AI 모델을 훈련할 수 있는 진입 장벽을…
3 MIN READ

2024년 10월 18일
DataStax, NVIDIA AI로 구축된 새로운 AI 개발 플랫폼 발표
AI 기술을 점점 더 많이 채택하는 기업들은 데이터 자산을 활용하기 위해 AI 애플리케이션을 효율적으로 개발, 보호하고 지속적으로 개선해야 하는…
4 MIN READ

2024년 10월 18일
AI 기반 시뮬레이션 및 디지털 트윈 기술을 통한 수술 로봇 공학 발전
수술실에 로봇 수술 보조(RSA)를 통합하면 외과의와 환자 모두에게 상당한 이점을 제공합니다. 현재 숙련된 외과의가 콘솔에서 원격 조작을 통해…
3 MIN READ

2024년 9월 25일
엣지에서 클라우드로 가속화된 Llama 3.2 배포하기
오픈 소스 Meta Llama 모델 컬렉션을 확장한 Llama 3.2 컬렉션에는 비전 언어 모델(VLM), 소규모 언어 모델(SLM)…
4 MIN READ