Posts by Erin Ho
对话式人工智能
2024年 8月 15日
NVIDIA TensorRT 模型优化器 v0.15 提高推理性能扩展模型支持能力
NVIDIA 宣布推出新版 v0.15 NVIDIA TensorRT 模型优化器,这是一种先进的模型优化技术量化工具包,包含量化、
2 MIN READ
对话式人工智能
2024年 7月 12日
利用新的 NVIDIA Megatron-Core 功能高效训练生成式 AI 模型
NVIDIA Megatron-LM 于 2019 年首次推出,在 AI 社区引发了一波创新浪潮,
3 MIN READ
生成式人工智能/大语言模型
2024年 5月 8日
NVIDIA TensorRT 模型优化器加速生成人工智能推理性能,现已公开
在快速发展的环境中,生成人工智能的发展对加速推理速度的需求仍然是一个紧迫的问题。随着模型规模和复杂性的指数级增长,
3 MIN READ
生成式人工智能/大语言模型
2024年 3月 7日
NVIDIA TensorRT 通过 8 位预训练量化将 Stable Diffusion 的速度提升近 2 倍
在生成式 AI 的动态领域,扩散模型脱颖而出,成为使用文本提示生成高质量图像的功能强大的架构 .
3 MIN READ