Anton Korzh

Anton Korzh 是 NVIDIA 高级深度学习研究 (ADLR) 团队的首席深度学习架构师。他热衷于突破大规模 AI 工作负载的通信性能和可扩展性极限,在分布式高性能计算方面拥有 20 年的经验。Anton 拥有莫斯科州立大学计算机科学博士学位。

Posts by Anton Korzh

生成式人工智能/大语言模型

NVSwitch 和 TensorRT-LLM MultiShot 共同加速 AllReduce 速度达 3 倍

在用户数量可能在数百到数十万之间波动,且输入序列长度随每个请求而变化的生产环境中,部署生成式 AI 工作负载会面临独特的挑战。 1 MIN READ