Posts by Mehran Maghoumi
数据科学
2024年 9月 10日
借助 NVIDIA NeMo Curator 简化域自适应预训练的数据处理
大语言模型(LLMs)的领域自适应预训练(DAPT)是构建特定领域模型的重要步骤。与现成的开放或商用模型相比,
6 MIN READ
数据科学
2024年 7月 31日
利用 NVIDIA NeMo Curator 整理用于 LLM 参数高效微调的自定义数据集
在最近的一篇博文中,我们讨论了如何使用 NVIDIA NeMo Curator 整理自定义数据集,
3 MIN READ
数据科学
2024年 5月 21日
利用 NVIDIA NeMo Curator 为 LLM 训练整理自定义数据集
数据管护是预训练和持续训练模型的第一步,也可以说是最重要的一步,对于 大型语言模型 (LLM) 和小型语言模型 (SLM) 都至关重要。
3 MIN READ
数据科学
2024年 3月 27日
借助 NVIDIA NeMo Curator 扩展和整理用于 LLM 训练的高质量数据集
大型语言模型 (LLM) 是提高运营效率和推动创新的强大工具。NVIDIA NeMo 微服务 旨在简化构建和部署模型的流程。
1 MIN READ