Posts by Chenjie Luo
对话式人工智能
2024年 9月 10日
使用 NVIDIA NeMo 和 NVIDIA TensorRT 模型优化器对 LLM 进行训练后量化
随着大语言模型(LLMs)的规模不断扩大,提供易于使用且高效的部署路径变得越来越重要,因为为此类 LLMs 提供服务的成本越来越高。
3 MIN READ
生成式人工智能/大语言模型
2024年 5月 8日
NVIDIA TensorRT 模型优化器加速生成人工智能推理性能,现已公开
在快速发展的环境中,生成人工智能的发展对加速推理速度的需求仍然是一个紧迫的问题。随着模型规模和复杂性的指数级增长,
3 MIN READ