Dan Su

Dan Su 是 NVIDIA 的研究科学家。她目前的研究重点是大语言模型预训练。她拥有香港科技大学的 NLP 博士学位。

Posts by Dan Su

对话式人工智能

宣布推出 Nemotron-CC:用于 LLM 预训练的万亿级英语语言数据集

NVIDIA 很高兴地宣布发布 Nemotron-CC,这是一种包含 6.3 万亿个令牌的 英语语言 Common Crawl 数据集 , 1 MIN READ