Posts by Mohammad Shoeybi
        
                    对话式人工智能
        
        
        2023年 8月 8日
      
      策展万亿代币数据集: NVIDIA NeMo 数据策展人介绍
                  
            这个大型语言模型 (LLM) 缩放规律的最新发展已经表明,当模型参数的数量进行缩放时,用于训练的令牌的数量也应该以相同的速率进行缩放。
                
          
            2 MIN READ
          
        
      
    
        
                    人工智能/深度学习
        
        
        2020年 10月 6日
      
      用 Megatron-CNTRL 为语言模型添加外部知识和可控性
                  
            大型语言模型,如 Megatron 和 GPT-3 正在改变人工智能。我们对能够利用这些模型来创建更好的对话式人工智能的应用程序感到兴奋。
                
          
            2 MIN READ