General
2024년 12월 13일
NVIDIA TensorRT-LLM, 인플라이트 배치로 인코더-디코더 모델 가속화
NVIDIA는 최근 NVIDIA TensorRT-LLM이 인코더-디코더 모델 아키텍처를 가속화한다고 발표했습니다.
3 MIN READ
2024년 11월 29일
NVIDIA NIM으로 파인 튜닝된 AI 모델 배포하기
도메인별 데이터로 AI 파운데이션 모델을 활용하려는 조직에서는 기업용 생성형 AI 애플리케이션으로 빠르고 효율적으로 가치를 제공하기 위해 파인…
3 MIN READ
2024년 11월 29일
Hymba 하이브리드 헤드 아키텍처로 소규모 언어 모델 성능 향상
어텐션 기반 아키텍처를 갖춘 트랜스포머는 강력한 성능, 병렬 처리, 키-값(KV) 캐시를 활용한 장기 기억 능력 덕분에 언어 모델(LM)로서 가장…
8 MIN READ
2024년 11월 22일
MLPerf Training v4.1에서 LLM 트레이닝 성능을 두 배로 향상시킨 NVIDIA Blackwell
모델이 커지고 더 많은 데이터로 학습되면서 기능이 늘어나고 활용도도 높아지고 있습니다. 이런 모델을 빠르게 훈련하려면 데이터센터 수준의 높은 성능이…
5 MIN READ
2024년 11월 15일
NVSwitch와 TensorRT-LLM 멀티샷으로 3배 빠른 AllReduce 구현
사용자 수가 수백 명에서 수십만 명까지 변동하고 각 요청의 입력 시퀀스 길이가 다른 프로덕션 환경에서 생성형 AI 워크로드를 배포하는 데는 여러…
3 MIN READ
2024년 11월 14일
NVIDIA NIM 웨비나: 고품질 멀티모달 데이터 처리로 생성형 AI 모델 정확도 향상에 참석하세요!
NVIDIA NeMo™ Curator로 개발자가 학습 및 사용자 지정을 위한 고품질 데이터 세트를 생성하기 위해 확장 가능한 데이터 처리…
1 MIN READ
2024년 11월 13일
NVIDIA NeMo를 사용한 최첨단 멀티모달 생성형 AI 모델 개발
생성형 AI는 텍스트 기반 모델에서 멀티모달 기능으로 빠르게 확장되며, 이미지 캡션 생성과 시각적 질문 응답 같은 작업을 수행해 보다 인간과 유사한…
4 MIN READ
2024년 11월 8일
로봇에게 집안일을 가르치기
로봇은 반복적이거나 시간이 많이 걸리는 작업을 수행함으로써 일상생활을 더 쉽게 만들어줄 수 있습니다. 스탠포드 대학의 연구원들은 NVIDIA GTC…
2 MIN READ
2024년 10월 25일
NVIDIA NeMo Curator로 처리된 Zyda-2 오픈 5T 토큰 데이터 세트로 정확도 높은 LLM 훈련하기
오픈 소스 데이터 세트는 고품질 데이터에 대한 액세스를 크게 대중화하여 개발자와 연구자들이 최첨단 생성형 AI 모델을 훈련할 수 있는 진입 장벽을…
3 MIN READ
2024년 10월 23일
NetworkX, NVIDIA cuGraph를 사용한 제로 코드 변경 가속화 도입
NVIDIA cuGraph로 가속화된 NetworkX는 NetworkX 팀과 공동 개발한 새로 출시된 백엔드입니다.
5 MIN READ
2024년 10월 18일
DataStax, NVIDIA AI로 구축된 새로운 AI 개발 플랫폼 발표
AI 기술을 점점 더 많이 채택하는 기업들은 데이터 자산을 활용하기 위해 AI 애플리케이션을 효율적으로 개발, 보호하고 지속적으로 개선해야 하는…
4 MIN READ
2024년 10월 2일
RAPIDS cuDF 기반 Polars GPU 엔진 오픈 베타 버전으로 출시
오늘 Polars는 데이터 과학자들이 단일 머신에서 수억 행의 데이터를 단 몇 초 만에 처리할 수 있도록 NVIDIA GPU에서 Polars…
3 MIN READ
2024년 9월 27일
AI와 로봇 공학이 농업 생산성과 지속가능성을 높이는 방법
John Deere는 2030년까지 완전 자율 농업을 목표로 노동력 부족, 지속 가능성, 식량 안보와 같은 글로벌 과제를 해결하고자 합니다.
1 MIN READ
2024년 9월 27일
전 세계 해양 오염 추적을 혁신하는 하이테크 AI 프레임워크
AI 기반 원격 감지 연구는 전 세계 해양 정화 노력을 위한 역동적인 새 도구를 제공합니다. ISPRS 사진측량 및 원격 감지 저널에 자세히 소개된…
3 MIN READ
2024년 9월 25일
엣지에서 클라우드로 가속화된 Llama 3.2 배포하기
오픈 소스 Meta Llama 모델 컬렉션을 확장한 Llama 3.2 컬렉션에는 비전 언어 모델(VLM), 소규모 언어 모델(SLM)…
4 MIN READ
2024년 9월 6일
더욱 쉬워진 CUDA 입문
이 포스팅은 NVIDIA의 인기 병렬 컴퓨팅 플랫폼이자 프로그래밍 모델인 CUDA에 대한 아주 간략한 소개입니다. 2013년에 CUDA에 대한 쉬운…
8 MIN READ