Arham Mehta

Arham Mehta 是 NVIDIA 深度学习软件团队的产品经理,专注于 NVIDIA NeMo.他曾在多家初创公司担任商业战略、机器学习和软件开发职务。他拥有 Mumbai 大学计算机工程学士学位和 USC 计算机科学硕士学位。

Posts by Arham Mehta

数据科学

使用 NVIDIA NeMo Curator 构建 Nemotron-CC:一个高质量万亿令牌数据集,用于大型语言模型预训练,源自 Common Crawl

对于想要训练先进的 大语言模型 (LLM) 的企业开发者而言,整理高质量的预训练数据集至关重要。为了让开发者能够构建高度准确的 LLM, 2 MIN READ
生成式人工智能/大语言模型

利用 NVIDIA NeMo Curator 整理非英语数据集以训练 LLM

数据管护在开发有效且公平的大型语言模型(LLMs)方面发挥着至关重要的作用。高质量、多样化的训练数据直接影响 LLMs 的性能,从而解决偏差、 3 MIN READ
数据科学

利用 NVIDIA NeMo Curator 为 LLM 训练整理自定义数据集

数据管护是预训练和持续训练模型的第一步,也可以说是最重要的一步,对于 大型语言模型 (LLM) 和小型语言模型 (SLM) 都至关重要。 3 MIN READ