Chenjie Luo

Chenjie Luo 是 NVIDIA 深度学习算法和软件团队的经理,领导 TensorRT 模型优化器的用户体验和生产。陈杰通过收购 OmniML,股份有限公司加入 NVIDIA ,成为早期团队成员。在此之前,他是 Nuro 开发自动驾驶机器人的软件经理,也是谷歌边缘加速的软件工程师。他在斯坦福大学获得电气工程硕士学位,在浙江大学获得学士学位。

Posts by Chenjie Luo

对话式人工智能

使用 NVIDIA NeMo 和 NVIDIA TensorRT 模型优化器对 LLM 进行训练后量化

随着大语言模型(LLMs)的规模不断扩大,提供易于使用且高效的部署路径变得越来越重要,因为为此类 LLMs 提供服务的成本越来越高。 3 MIN READ
生成式人工智能/大语言模型

NVIDIA TensorRT 模型优化器加速生成人工智能推理性能,现已公开

在快速发展的环境中,生成人工智能的发展对加速推理速度的需求仍然是一个紧迫的问题。随着模型规模和复杂性的指数级增长, 3 MIN READ