Posts by Janaki Vamaraju
数据科学
2025年 5月 7日
使用 NVIDIA NeMo Curator 构建 Nemotron-CC:一个高质量万亿令牌数据集,用于大型语言模型预训练,源自 Common Crawl
对于想要训练先进的 大语言模型 (LLM) 的企业开发者而言,整理高质量的预训练数据集至关重要。为了让开发者能够构建高度准确的 LLM,
2 MIN READ
生成式人工智能/大语言模型
2024年 10月 10日
NVIDIA NIM 微服务助力电信 O-RAN 规范高级 RAG 技术实现
移动通信标准通过协调技术协议来促进不同供应商的网络和设备之间的互操作性,在电信生态系统中发挥着至关重要的作用。随着这些标准的发展,
2 MIN READ
数据科学
2024年 9月 10日
借助 NVIDIA NeMo Curator 简化域自适应预训练的数据处理
大语言模型(LLMs)的领域自适应预训练(DAPT)是构建特定领域模型的重要步骤。与现成的开放或商用模型相比,
6 MIN READ