Generative AI
2024년 8월 28일
파인 튜닝을 위한 LoRA의 강력한 대안, DoRA 살펴보기
전체 파인 튜닝(FT)은 일반적으로 특정 다운스트림 작업에 맞게 미리 학습된 일반 모델을 조정하는 데 사용됩니다. 학습 비용을 줄이기 위해 최소한의…
4 MIN READ
2024년 8월 23일
LLM 추론 크기 조정 및 성능 최적화를 위한 실용적인 전략
챗봇, 콘텐츠 제작 등 다양한 애플리케이션에서 거대 언어 모델(LLM)의 사용이 증가함에 따라 추론 시스템을 확장하고 최적화하는 과정을 이해하여…
1 MIN READ
2024년 8월 21일
LLM 에이전트 소개
재무 분석가가 회사의 실적에 대한 질문에 답할 수 있도록 설계된 거대 언어 모델(LLM) 애플리케이션은 잘 설계된 검색 증강 생성(RAG)…
6 MIN READ
2024년 8월 14일
Writer, 의료 및 금융을 위한 도메인별 LLM 출시
Writer는 두 가지 새로운 도메인 전용 AI 모델인 Palmyra-Med 70B와 Palmyra-Fin 70B를 출시하여 NVIDIA NIM의…
4 MIN READ
2024년 6월 24일
Windows RTX PC용 NVIDIA RTX AI 툴킷으로 AI 기반 앱 개발 간소화
NVIDIA는 오늘 Windows 애플리케이션 개발자가 Windows 애플리케이션용 AI 모델을 맞춤화, 최적화 및 배포할 수 있는 도구 및…
5 MIN READ
2024년 6월 5일
Wistron, AI 및 NVIDIA Omniverse를 통해 제조 분야의 에너지 효율을 향상시키다
ESG 투자 및 이니셔티브가 점점 더 강조되면서 제조업체는 운영 전반에 걸쳐 에너지 효율성과 지속 가능성을 높일 수 있는 새로운 방법을 모색하고…
3 MIN READ
2024년 5월 29일
생성형 AI 에이전트 개발자 컨테스트에 참여하세요!
저희는 NVIDIA 및 LangChain 기술을 사용하여 생성형 AI 기반 애플리케이션의 경계를 넓힐 AI 혁신가를 찾고 있습니다. 코드 생성…
1 MIN READ
2024년 5월 24일
NVIDIA NeMo를 활용한 현지화된 다국어 LLM 트레이닝, 1부
오늘날과 같이 글로벌화된 세계에서 다양한 언어를 이해하고 소통하는 AI 시스템의 능력은 점점 더 중요해지고 있습니다. 거대 언어 모델(LLM)은…
8 MIN READ
2024년 5월 3일
NVIDIA TensorRT-LLM 및 NVIDIA Triton Inference Server로 Meta Llama 3 성능 강화
LLM 추론 성능을 가속화 및 최적화하는 NVIDIA TensorRT-LLM의 Meta Llama 3 모델 제품군에 대한 지원을 발표합니다.
5 MIN READ
2023년 11월 27일
LLM 기술 마스터하기: LLMOps
생성형 AI 앱 개발 여정을 간략하게 설명하고, GenAIOps와 LLMOps의 개념을 정의한 다음, 이를 MLOps와 비교 설명할 예정입니다
8 MIN READ
2023년 9월 12일
추론 성능 가속화하는 새로운 소프트웨어 TensorRT-LLM 출시
대규모 언어 모델(LLM)의 획기적인 새로운 기능은 AI의 영역을 넓히고 있습니다. 그러나 큰 크기와 특수한 실행 특성으로 비용 효율적인 방식으로…
5 MIN READ
2023년 6월 7일
NVIDIA DGX GH200 발표: 최초의 100테라바이트 GPU 메모리 시스템
COMPUTEX 2023에서 NVIDIA는 가장 까다로운 대규모 AI 워크로드를 지원하는 GPU 가속 컴퓨팅 분야의 또 다른 혁신인 NVIDIA…
4 MIN READ
2023년 5월 19일
NVIDIA BlueField-3 DPU로 차세대 애플리케이션의 물결에 힘을 더하세요.
ChatGPT, Stable Diffusion, DALL-E 및 이와 유사한 애플리케이션이 세상을 생성형 AI에 눈을 뜨게 했습니다.
5 MIN READ
2023년 4월 28일
NVIDIA Faster Transformer를 통한 KoGPT의 추론 가속화
트랜스포머는 오늘날 가장 영향력 있는 AI 모델 아키텍처 중 하나이며 미래 AI R&D의 방향을 형성하고 있습니다. 자연어 처리(NLP)를 위한…
4 MIN READ
2023년 4월 5일
언어, 시각 콘텐츠, 생물학 애플리케이션을 위한 NVIDIA의 ‘생성형 AI 서비스’
NVIDIA AI Foundations는 텍스트 언어, 시각 미디어, 생물학 언어를 위한 최첨단 기초 모델부터 시작하여 맞춤형 생성형 AI를 구축하고 실행할 수 있는 간소화된 접근법을 기업에 제공하는 클라우드 서비스 제품군입니다.
2 MIN READ
2023년 4월 4일
AI 추론을 강화하는 NVIDIA Triton과 NVIDIA TensorRT의 새로운 기능
NVIDIA AI 추론 소프트웨어는 모든 AI 딥 러닝 사용 사례에 대해 가속화된 추론을 제공합니다.
3 MIN READ