Dan Su

Dan Su는 NVIDIA의 연구 과학자입니다. 현재 대규모 언어 모델 사전 훈련에 중점을 두고 연구하고 있습니다. 홍콩과학기술대학교에서 NLP 박사 학위를 받았습니다.

Posts by Dan Su

Conversational AI / NLP

Nemotron-CC를 소개합니다: LLM 사전 학습을 위한 1조 토큰 규모의 영어 데이터 세트 공개

NVIDIA는 1조 9천억 개의 합성 생성 데이터를 포함하여 매우 정확한 거대 언어 모델(LLM)의 사전 학습을 위한 6조 3천억 개의 토큰으로… 3 MIN READ