Generative AI
2025년 1월 17일
Nemotron-CC를 소개합니다: LLM 사전 학습을 위한 1조 토큰 규모의 영어 데이터 세트 공개
NVIDIA는 1조 9천억 개의 합성 생성 데이터를 포함하여 매우 정확한 거대 언어 모델(LLM)의 사전 학습을 위한 6조 3천억 개의 토큰으로…
3 MIN READ
2024년 12월 13일
새로운 AI 연구가 자율 로봇 수술의 미래를 열어가고 있습니다.
외과의가 일상적인 수술에서 일반적으로 사용하며 수동으로 조작하던 로봇이 이제 인간처럼 정밀하게 주요 수술 작업을 자율적으로 수행할 수 있게…
2 MIN READ
2024년 12월 13일
NVIDIA TensorRT-LLM, 인플라이트 배치로 인코더-디코더 모델 가속화
NVIDIA는 최근 NVIDIA TensorRT-LLM이 인코더-디코더 모델 아키텍처를 가속화한다고 발표했습니다.
3 MIN READ
2024년 12월 6일
지각 AI를 위한 생성형 AI 지원 합성 데이터 파이프라인을 구축하는 방법
자율주행 차량이나 로봇과 같은 자율 시스템을 구동하는 물리 AI 모델을 학습하려면 방대한 양의 데이터가 필요합니다. 하지만 다양한 훈련 데이터…
4 MIN READ
2024년 12월 4일
물리적으로 시뮬레이션된 휴머노이드를 위한 통합 전신 제어
자연스럽게 움직이고 다양한 제어 입력에 지능적으로 반응하는 인터랙티브 시뮬레이션 휴머노이드를 개발하는 것은 컴퓨터 애니메이션과 로봇 공학에서 가장…
4 MIN READ
2024년 11월 29일
NVIDIA NIM으로 파인 튜닝된 AI 모델 배포하기
도메인별 데이터로 AI 파운데이션 모델을 활용하려는 조직에서는 기업용 생성형 AI 애플리케이션으로 빠르고 효율적으로 가치를 제공하기 위해 파인…
3 MIN READ
2024년 11월 29일
Hymba 하이브리드 헤드 아키텍처로 소규모 언어 모델 성능 향상
어텐션 기반 아키텍처를 갖춘 트랜스포머는 강력한 성능, 병렬 처리, 키-값(KV) 캐시를 활용한 장기 기억 능력 덕분에 언어 모델(LM)로서 가장…
8 MIN READ
2024년 11월 27일
NVIDIA NIM으로 첫번째 휴먼 인더 루프 AI 에이전트 구축하기
거대 언어 모델(LLM)로 구동되는 AI 에이전트는 조직이 반복적인 수작업을 간소화하고 업무량을 줄이는 데 큰 도움을 줍니다.
7 MIN READ
2024년 11월 20일
NVIDIA AI Enterprise를 통한 보안 강화 및 AI 에이전트 배포 간소화
AI 에이전트는 조직이 효율성을 높이고 생산성을 개선하며 혁신 속도를 높이는 새로운 방식으로 주목받고 있습니다. 이 에이전트들은 자율적으로 작업을…
4 MIN READ
2024년 11월 15일
NVSwitch와 TensorRT-LLM 멀티샷으로 3배 빠른 AllReduce 구현
사용자 수가 수백 명에서 수십만 명까지 변동하고 각 요청의 입력 시퀀스 길이가 다른 프로덕션 환경에서 생성형 AI 워크로드를 배포하는 데는 여러…
3 MIN READ
2024년 11월 15일
NVIDIA AI Blueprint로 비디오 검색 및 요약 에이전트 구축하기
이 게시물은 2024년 7월 29일에 처음 게시되었으나, 이후 NVIDIA AI Blueprint 정보를 바탕으로 수정되었습니다.
6 MIN READ
2024년 11월 13일
NVIDIA NeMo를 사용한 최첨단 멀티모달 생성형 AI 모델 개발
생성형 AI는 텍스트 기반 모델에서 멀티모달 기능으로 빠르게 확장되며, 이미지 캡션 생성과 시각적 질문 응답 같은 작업을 수행해 보다 인간과 유사한…
4 MIN READ
2024년 11월 8일
로봇에게 집안일을 가르치기
로봇은 반복적이거나 시간이 많이 걸리는 작업을 수행함으로써 일상생활을 더 쉽게 만들어줄 수 있습니다. 스탠포드 대학의 연구원들은 NVIDIA GTC…
2 MIN READ
2024년 11월 6일
높은 처리량의 AI 기반 신약 개발 파이프라인
신약 발견에 AI를 접목하면서 연구자들이 다양한 질병에 대한 새로운 치료법을 개발하는 방식이 혁신적으로 변화하고 있습니다.
4 MIN READ
2024년 11월 1일
늑대를 구하기 위해 울부짖는 소리를 추적하는 AI 기반 디바이스
광활한 외딴 지역에 설치할 수 있는 휴대폰 크기의 새로운 기기는 AI를 사용하여 야생동물을 식별하고 지리적 위치를 파악하여 옐로스톤 국립공원 주변의…
3 MIN READ
2024년 10월 30일
추론 속도를 2배 높인 NVIDIA GH200 슈퍼칩, Llama 모델과의 멀티턴 상호작용에서 추론 가속화
프로덕션 환경에 거대 언어 모델(LLM)을 배포하려면 사용자 상호 작용을 향상시키는 것과 시스템 처리량을 늘리는 것 사이에서 어려운 절충점을 찾아야…
4 MIN READ