Hardware / Semiconductor
2024년 7월 3일
NVIDIA NIM을 통해 원활하게 여러 LoRA 어댑터 배포
최신 최첨단 파운데이션 거대 언어 모델(LLM)에는 수십억 개의 매개 변수가 있으며 수조 개의 입력 텍스트 토큰에 대해 사전 트레이닝됩니다.
7 MIN READ
2024년 5월 29일
업그레이드된 NVIDIA TensorRT 10.0의 사용성, 성능, AI 모델 지원
NVIDIA는 오늘 고성능 딥 러닝 추론을 위한 API 에코시스템인 NVIDIA TensorRT의 최신 릴리스를 발표했습니다.
4 MIN READ
2024년 5월 17일
NVIDIA TensorRT Model Optimizer로 생성형 AI 추론 성능 가속화
빠르게 진화하는 생성형 AI 환경에서 가속화된 추론 속도에 대한 요구는 여전히 시급한 문제입니다. 모델 크기와 복잡성이 기하급수적으로 증가함에 따라…
6 MIN READ
2024년 5월 11일
NVIDIA H100 Tensor 코어 GPU에서의 컨피덴셜 컴퓨팅 일반 액세스 발표
NVIDIA는 2023년 7월 NVIDIA LaunchPad를 통해 컨피덴셜 컴퓨팅(CC) 초기 버전 솔루션을 비공개 프리뷰 형태의 얼리 액세스…
2 MIN READ
2024년 4월 26일
NVIDIA AI Enterprise IGX를 통해 엣지에서 중요 업무용 AI 지원
NVIDIA SDK는 스마트 시티, 의료, 로보틱스를 아우르는 다양한 사용 사례에서 AI 애플리케이션을 가속하는 데 중요한 역할을 해왔습니다.
3 MIN READ
2024년 3월 15일
LLM 아키텍처에 Mixture of Experts(MoE)를 활용하기
Mixture of Experts(MoE) 거대 언어 모델(LLM) 아키텍처는 최근 GPT-4와 같은 독점 LLM은 물론 Mixtral 8x7B의…
7 MIN READ
2024년 2월 23일
Supermicro에서 제공하는 AI 네트워크 성능을 위한 NVIDIA Spectrum-X 벤치마킹, 이제 이용 가능
NVIDIA Spectrum-X는 하이퍼스케일 클라우드 인프라에서 AI에 맞춤화된 선도적인 네트워킹 플랫폼으로 빠르게 주목받고 있습니다.
4 MIN READ
2024년 1월 19일
NVIDIA TensorRT로 가속화된 새롭고 안정적인 확산 모델
CES에서 NVIDIA는 SDXL Turbo, LCM-LoRA 및 Stable Video Diffusion이 모두 NVIDIA TensorRT에…
2 MIN READ
2024년 1월 10일
NVIDIA RTX 시스템으로 Windows PC에서 LLM 애플리케이션 강화하기
거대 언어 모델(LLM)은 우리가 컴퓨터와 상호작용하는 방식을 근본적으로 바꾸고 있습니다. 이러한 모델은 인터넷 검색부터 사무 생산성 도구에…
3 MIN READ
2023년 10월 11일
데이터센터 리던던시 강화를 위한 솔루션 비교
오늘날의 데이터센터에서는 패브릭에 연결된 서버에서 시스템 이중화를 달성하는 여러 가지 방법이 있습니다. 고객은 일반적으로 다양한 멀티호밍 기술을…
5 MIN READ