Boxiang Wang

Boxiang Wang 是 NVIDIA 的深度学习算法工程师,专门从事大规模大语言模型 (LLM) 训练。他为 NVIDIA NeMo 框架和 Megatron-Core 做出了贡献,专注于长上下文 LLM 训练、先进的模型架构和高级模型并行技术。此前,他是 ColossalAI 的创始工程师和研究员。他拥有南洋理工大学工程学士学位和哈佛大学计算科学与工程硕士学位。

Posts by Boxiang Wang

对话式人工智能

通过高效的长上下文大语言模型训练扩展到数百万个 Token

大语言模型 (LLM) 的演变标志着其处理和生成文本的能力有了显著提升。在这些发展中,上下文长度的概念 (模型可以处理的单个输入样本中的… 2 MIN READ