Posts by Sandeep Subramanian
        
                    对话式人工智能
        
        
        2023年 8月 8日
      
      策展万亿代币数据集: NVIDIA NeMo 数据策展人介绍
                  
            这个大型语言模型 (LLM) 缩放规律的最新发展已经表明,当模型参数的数量进行缩放时,用于训练的令牌的数量也应该以相同的速率进行缩放。
                
          
            2 MIN READ