Kezhi Kong

Kezhi Kong 是 NVIDIA 的研究科学家,也是 Foundation Model 团队的成员。他在马里兰大学计算机科学系获得了博士学位。他的研究重点是构建先进的大语言模型,特别是通过提高预训练数据的质量和扩展数据规模以及增强预训练算法。

Posts by Kezhi Kong

对话式人工智能

宣布推出 Nemotron-CC:用于 LLM 预训练的万亿级英语语言数据集

NVIDIA 很高兴地宣布发布 Nemotron-CC,这是一种包含 6.3 万亿个令牌的 英语语言 Common Crawl 数据集 , 1 MIN READ