Posts by Bryan Catanzaro
对话式人工智能/自然语言处理
2023年 8月 8日
策展万亿代币数据集: NVIDIA NeMo 数据策展人介绍
这个大型语言模型 (LLM) 缩放规律的最新发展已经表明,当模型参数的数量进行缩放时,用于训练的令牌的数量也应该以相同的速率进行缩放。
2 MIN READ
人工智能/深度学习
2020年 10月 6日
用 Megatron-CNTRL 为语言模型添加外部知识和可控性
大型语言模型,如 Megatron 和 GPT-3 正在改变人工智能。我们对能够利用这些模型来创建更好的对话式人工智能的应用程序感到兴奋。
2 MIN READ