Generative AI
2024년 12월 20일
NVIDIA Jetson Orin Nano 개발자 키트, “슈퍼” 부스트
Jetson Orin Nano 개발자 키트는 소프트웨어 업데이트만으로 Jetson Orin Nano Super 개발자 키트로 업그레이드할 수 있습니다.
7 MIN READ
2024년 11월 27일
NVIDIA NIM으로 첫번째 휴먼 인더 루프 AI 에이전트 구축하기
거대 언어 모델(LLM)로 구동되는 AI 에이전트는 조직이 반복적인 수작업을 간소화하고 업무량을 줄이는 데 큰 도움을 줍니다.
7 MIN READ
2024년 11월 22일
MLPerf Training v4.1에서 LLM 트레이닝 성능을 두 배로 향상시킨 NVIDIA Blackwell
모델이 커지고 더 많은 데이터로 학습되면서 기능이 늘어나고 활용도도 높아지고 있습니다. 이런 모델을 빠르게 훈련하려면 데이터센터 수준의 높은 성능이…
5 MIN READ
2024년 11월 20일
NVIDIA AI Enterprise를 통한 보안 강화 및 AI 에이전트 배포 간소화
AI 에이전트는 조직이 효율성을 높이고 생산성을 개선하며 혁신 속도를 높이는 새로운 방식으로 주목받고 있습니다. 이 에이전트들은 자율적으로 작업을…
4 MIN READ
2024년 8월 28일
파인 튜닝을 위한 LoRA의 강력한 대안, DoRA 살펴보기
전체 파인 튜닝(FT)은 일반적으로 특정 다운스트림 작업에 맞게 미리 학습된 일반 모델을 조정하는 데 사용됩니다. 학습 비용을 줄이기 위해 최소한의…
4 MIN READ
2024년 8월 23일
LLM 추론 크기 조정 및 성능 최적화를 위한 실용적인 전략
챗봇, 콘텐츠 제작 등 다양한 애플리케이션에서 거대 언어 모델(LLM)의 사용이 증가함에 따라 추론 시스템을 확장하고 최적화하는 과정을 이해하여…
1 MIN READ
2024년 8월 21일
LLM 에이전트 소개
재무 분석가가 회사의 실적에 대한 질문에 답할 수 있도록 설계된 거대 언어 모델(LLM) 애플리케이션은 잘 설계된 검색 증강 생성(RAG)…
6 MIN READ
2024년 8월 14일
Writer, 의료 및 금융을 위한 도메인별 LLM 출시
Writer는 두 가지 새로운 도메인 전용 AI 모델인 Palmyra-Med 70B와 Palmyra-Fin 70B를 출시하여 NVIDIA NIM의…
4 MIN READ
2024년 6월 24일
Windows RTX PC용 NVIDIA RTX AI 툴킷으로 AI 기반 앱 개발 간소화
NVIDIA는 오늘 Windows 애플리케이션 개발자가 Windows 애플리케이션용 AI 모델을 맞춤화, 최적화 및 배포할 수 있는 도구 및…
5 MIN READ
2024년 6월 5일
Wistron, AI 및 NVIDIA Omniverse를 통해 제조 분야의 에너지 효율을 향상시키다
ESG 투자 및 이니셔티브가 점점 더 강조되면서 제조업체는 운영 전반에 걸쳐 에너지 효율성과 지속 가능성을 높일 수 있는 새로운 방법을 모색하고…
3 MIN READ
2024년 5월 29일
생성형 AI 에이전트 개발자 컨테스트에 참여하세요!
저희는 NVIDIA 및 LangChain 기술을 사용하여 생성형 AI 기반 애플리케이션의 경계를 넓힐 AI 혁신가를 찾고 있습니다. 코드 생성…
1 MIN READ
2024년 5월 24일
NVIDIA NeMo를 활용한 현지화된 다국어 LLM 트레이닝, 1부
오늘날과 같이 글로벌화된 세계에서 다양한 언어를 이해하고 소통하는 AI 시스템의 능력은 점점 더 중요해지고 있습니다. 거대 언어 모델(LLM)은…
8 MIN READ
2024년 5월 3일
NVIDIA TensorRT-LLM 및 NVIDIA Triton Inference Server로 Meta Llama 3 성능 강화
LLM 추론 성능을 가속화 및 최적화하는 NVIDIA TensorRT-LLM의 Meta Llama 3 모델 제품군에 대한 지원을 발표합니다.
5 MIN READ
2023년 11월 27일
LLM 기술 마스터하기: LLMOps
생성형 AI 앱 개발 여정을 간략하게 설명하고, GenAIOps와 LLMOps의 개념을 정의한 다음, 이를 MLOps와 비교 설명할 예정입니다
8 MIN READ
2023년 9월 12일
추론 성능 가속화하는 새로운 소프트웨어 TensorRT-LLM 출시
대규모 언어 모델(LLM)의 획기적인 새로운 기능은 AI의 영역을 넓히고 있습니다. 그러나 큰 크기와 특수한 실행 특성으로 비용 효율적인 방식으로…
5 MIN READ
2023년 6월 7일
NVIDIA DGX GH200 발표: 최초의 100테라바이트 GPU 메모리 시스템
COMPUTEX 2023에서 NVIDIA는 가장 까다로운 대규모 AI 워크로드를 지원하는 GPU 가속 컴퓨팅 분야의 또 다른 혁신인 NVIDIA…
4 MIN READ