General
2024년 5월 9일
Replay – GTC Korean AI Expert Day에 참석하세요!
5월 29일 수요일 오후 2시부터 오후 3시까지 진행되는 한국 고객을 위한 Replay – GTC Korean AI Expert Day에 여러분을…
1 MIN READ
2024년 5월 9일
하이엔드 그래픽 워크로드를 위한 NVIDIA RTX 가상 워크스테이션이 탑재된 GPU 기반 Windows 365 클라우드 PC
그래픽 집약적인 시나리오에 대한 수요가 증가함에 따라 전문 워크플로우는 더욱 복잡해졌습니다. 일반 사무용 애플리케이션부터 까다로운 제조, 건축…
5 MIN READ
2024년 5월 3일
NVIDIA NeMo Canary 모델의 음성 인식 및 번역을 위한 새로운 표준
NVIDIA NeMo는 클라우드와 온프레미스를 포함하여 어디서든 규모별 멀티모달 생성형 AI 모델을 개발하기 위한 엔드 투 엔드 플랫폼입니다.
3 MIN READ
2024년 5월 3일
Union.ai 및 NVIDIA DGX Cloud를 통한 AI 워크플로우 대중화
GPU는 초기에 비디오 게임에서 3D 그래픽을 렌더링하는 데 특화되어 있었으며 주로 선형 대수 계산을 가속화했습니다. 오늘날 GPU는 AI 혁명의…
4 MIN READ
2024년 5월 3일
NVIDIA TensorRT-LLM 및 NVIDIA Triton Inference Server로 Meta Llama 3 성능 강화
LLM 추론 성능을 가속화 및 최적화하는 NVIDIA TensorRT-LLM의 Meta Llama 3 모델 제품군에 대한 지원을 발표합니다.
5 MIN READ
2024년 4월 23일
NVIDIA BlueField를 통한 퍼블릭 클라우드 서비스 네트워크의 효율적인 적용
DPU(Data Processing Unit) 기술은 최근 네트워크 및 데이터 센터 분야에서 성능 향상과 보안 강화를 위해 중요한 역할을 하고…
4 MIN READ
2024년 4월 11일
멀티모달 검색 증강 생성 101
검색 증강 생성 (RAG) 애플리케이션은 텍스트뿐만 아니라 표, 그래프, 차트, 다이어그램 등 다양한 데이터 유형으로 작업을 수행할 수 있다면 그…
7 MIN READ
2024년 3월 15일
LLM 아키텍처에 Mixture of Experts(MoE)를 활용하기
Mixture of Experts(MoE) 거대 언어 모델(LLM) 아키텍처는 최근 GPT-4와 같은 독점 LLM은 물론 Mixtral 8x7B의…
7 MIN READ
2024년 3월 12일
8-bit 포스트 트레이닝 양자화로 안정적인 확산을 2배 더 빠르게 가속화하는 NVIDIA TensorRT
생성형 AI의 동적 영역에서 확산 모델은 텍스트 프롬프트가 포함된 고품질 이미지를 생성하기 위한 가장 강력한 아키텍처로 각광받고 있습니다.
5 MIN READ
2024년 3월 8일
NVIDIA AI 추론 플랫폼에서 안정적인 Diffusion XL로 멋진 이미지 생성하기
확산 모델은 산업 전반의 크리에이티브 워크플로우를 혁신하고 있습니다. 이 모델은 노이즈 제거 확산 기술을 통해 무작위 노이즈를 반복적으로 AI 기반…
8 MIN READ
2024년 3월 7일
StarCoder2로 LLM 코딩 잠재력 활용하기
코딩은 디지털 시대에 필수적이지만 지루하고 시간이 많이 소요될 수 있습니다. 그렇기 때문에 많은 개발자가 거대 언어 모델(LLM)의 도움을 받아…
4 MIN READ