Ying Lin

Ying Lin 是 NVIDIA 的研究科学家,主要致力于提高预训练数据质量和生成合成数据。加入 NVIDIA 之前,他曾在 Apple 从事自然语言理解工作。他拥有伊利诺伊大学香槟分校的博士学位。

Posts by Ying Lin

对话式人工智能

宣布推出 Nemotron-CC:用于 LLM 预训练的万亿级英语语言数据集

NVIDIA 很高兴地宣布发布 Nemotron-CC,这是一种包含 6.3 万亿个令牌的 英语语言 Common Crawl 数据集 , 1 MIN READ