NeMo Framework

2023년 11월 27일
LLM 기술 마스터하기: 인퍼런스 최적화
트랜스포머 레이어를 쌓아 대규모 모델을 만들면 다양한 언어 작업에서 정확도가 향상되고, 퓨샷 러닝이 가능하며, 심지어 인간에 가까운 능력을 발휘할…
15 MIN READ

2023년 11월 27일
LLM 기술 마스터하기: LLMOps
생성형 AI 앱 개발 여정을 간략하게 설명하고, GenAIOps와 LLMOps의 개념을 정의한 다음, 이를 MLOps와 비교 설명할 예정입니다
8 MIN READ

2023년 11월 10일
기업 솔루션 제공을 위한 거대 언어 모델 시작하기
거대 언어 모델(LLM)은 수천억 개의 매개변수가 포함된 인터넷 규모의 데이터 세트로 학습된 딥 러닝 알고리즘입니다. LLM은 읽고, 쓰고…
8 MIN READ

2023년 10월 18일
SteerLM: 추론 중에 LLM을 맞춤 설정할 수 있는 간단하고 실용적인 기법
최근 몇 년 동안 GPT-3, Megatron-Turing, Chinchilla, PaLM-2, Falcon, Llama 2와 같은 대규모 언어…
6 MIN READ

2023년 9월 12일
추론 성능 가속화하는 새로운 소프트웨어 TensorRT-LLM 출시
대규모 언어 모델(LLM)의 획기적인 새로운 기능은 AI의 영역을 넓히고 있습니다. 그러나 큰 크기와 특수한 실행 특성으로 비용 효율적인 방식으로…
5 MIN READ

2023년 7월 12일
맞춤형 언어 모델을 생성하는 방법
대규모 언어 모델은 강력하고 다재다능하지만 제로 샷 및 소수 샷 프롬프트 기법으로는 그 힘을 충분히 활용하지 못할 수 있습니다. 매개변수 효율적인 사용자 지정 기법이 해결책을 제시합니다.
8 MIN READ

2023년 4월 28일
NVIDIA Faster Transformer를 통한 KoGPT의 추론 가속화
트랜스포머는 오늘날 가장 영향력 있는 AI 모델 아키텍처 중 하나이며 미래 AI R&D의 방향을 형성하고 있습니다. 자연어 처리(NLP)를 위한…
4 MIN READ