Deep dive
2024년 12월 20일
NVIDIA Jetson Orin Nano 개발자 키트, “슈퍼” 부스트
Jetson Orin Nano 개발자 키트는 소프트웨어 업데이트만으로 Jetson Orin Nano Super 개발자 키트로 업그레이드할 수 있습니다.
7 MIN READ
2024년 11월 29일
Hymba 하이브리드 헤드 아키텍처로 소규모 언어 모델 성능 향상
어텐션 기반 아키텍처를 갖춘 트랜스포머는 강력한 성능, 병렬 처리, 키-값(KV) 캐시를 활용한 장기 기억 능력 덕분에 언어 모델(LM)로서 가장…
8 MIN READ
2024년 11월 20일
NVIDIA AI Enterprise를 통한 보안 강화 및 AI 에이전트 배포 간소화
AI 에이전트는 조직이 효율성을 높이고 생산성을 개선하며 혁신 속도를 높이는 새로운 방식으로 주목받고 있습니다. 이 에이전트들은 자율적으로 작업을…
4 MIN READ
2024년 11월 15일
NVSwitch와 TensorRT-LLM 멀티샷으로 3배 빠른 AllReduce 구현
사용자 수가 수백 명에서 수십만 명까지 변동하고 각 요청의 입력 시퀀스 길이가 다른 프로덕션 환경에서 생성형 AI 워크로드를 배포하는 데는 여러…
3 MIN READ
2024년 11월 15일
NVIDIA AI Blueprint로 비디오 검색 및 요약 에이전트 구축하기
이 게시물은 2024년 7월 29일에 처음 게시되었으나, 이후 NVIDIA AI Blueprint 정보를 바탕으로 수정되었습니다.
6 MIN READ
2024년 11월 1일
NVIDIA Morpheus를 사용하여 보안 운영 센터의 경보 분류 및 LLM 에이전트 가속화
보안관제센터(SOC) 분석가들은 매일 엄청난 양의 보안 경고를 수신합니다. 조직의 지속적인 안전을 보장하기 위해 이들은 수신되는 노이즈 속에서…
4 MIN READ
2024년 10월 23일
NetworkX, NVIDIA cuGraph를 사용한 제로 코드 변경 가속화 도입
NVIDIA cuGraph로 가속화된 NetworkX는 NetworkX 팀과 공동 개발한 새로 출시된 백엔드입니다.
5 MIN READ
2024년 9월 25일
엣지에서 클라우드로 가속화된 Llama 3.2 배포하기
오픈 소스 Meta Llama 모델 컬렉션을 확장한 Llama 3.2 컬렉션에는 비전 언어 모델(VLM), 소규모 언어 모델(SLM)…
4 MIN READ
2024년 8월 30일
NVLink Switch가 탑재된 NVIDIA HGX H200의 Medusa로 최대 1.9배 향상된 Llama 3.1 성능
거대 언어 모델(LLM)의 크기와 복잡성이 계속 증가함에 따라, 실시간 생성형 AI 애플리케이션이 요구하는 짧은 지연 시간과 높은 처리량을 제공하기…
3 MIN READ
2024년 8월 28일
파인 튜닝을 위한 LoRA의 강력한 대안, DoRA 살펴보기
전체 파인 튜닝(FT)은 일반적으로 특정 다운스트림 작업에 맞게 미리 학습된 일반 모델을 조정하는 데 사용됩니다. 학습 비용을 줄이기 위해 최소한의…
4 MIN READ
2024년 8월 23일
시뮬레이션에서 빠르게 로봇을 학습하기 위해 NVIDIA Isaac Lab 사용하기
로봇은 새로운 기술을 쉽게 배우고 주변 환경에 적응할 수 있는 적응력을 갖춰야 합니다. 하지만 기존의 교육 방법으로는 로봇이 새로운 상황에서 학습한…
5 MIN READ
2024년 8월 21일
LLM 에이전트 소개
재무 분석가가 회사의 실적에 대한 질문에 답할 수 있도록 설계된 거대 언어 모델(LLM) 애플리케이션은 잘 설계된 검색 증강 생성(RAG)…
6 MIN READ
2024년 8월 9일
CUDA 그래프로 llama.cpp AI 추론 최적화하기
오픈 소스인 llama.cpp 코드 베이스는 원래 2023년에 출시된 가볍지만 효율적인 프레임워크로서 Meta Llama 모델에 대한 추론을…
5 MIN READ
2024년 8월 2일
NVIDIA NeMo Retriever로 RAG를 위한 프로덕션급 텍스트 검색 파이프라인 개발
기업들은 효율성을 개선하고 비용을 절감하며 궁극적으로 생산성을 높이는 데 활용되기를 기다리는 데이터의 금광에 앉아 있습니다.
4 MIN READ
2024년 8월 2일
NVIDIA 플랫폼 전반에서 Llama 3.1 강화하기
Meta의 Llama 거대 언어 모델 컬렉션은 오늘날 오픈 소스 커뮤니티에서 가장 인기 있는 파운데이션 모델로, 다양한 사용 사례를 지원합니다.
5 MIN READ
2024년 7월 19일
기하학적 구조에 대한 시뮬레이션과 실제 로봇 조립 기술 훈련
가정 및 산업 환경에서 대부분의 물체는 조립해야 하는 여러 부품으로 이루어져 있습니다. 조립은 일반적으로 인간 작업자가 하지만…
6 MIN READ