Posts by Karthik Mandakolathur
数据科学
2022年 2月 28日
使用 NVIDIA Collective Communication Library 2.12 将所有 all2all 性能翻倍
集体通信是现代分布式人工智能培训工作(如推荐系统和自然语言处理)的一个关键性能组成部分。
3 MIN READ
人工智能/深度学习
2021年 12月 1日
通过全堆栈优化提升 NVIDIA MLPerf Training v1.1 的性能
自 v1.0 以来已经过去了五个月,所以是时候进行新一轮 MLPerf 培训基准了。在这个 v1.1 版本中,
5 MIN READ