Zhiyu Cheng

Zhiyu Cheng 是 NVIDIA 的技术负责人经理,负责推动 NVIDIA GPU 和云服务 (NeMo/Picasso) 的大型语言模型 (LLM) 和扩散模型优化。在他的职业生涯中,Zhiyu 曾在 NXP、Xilinx、百度和 OmniML (已被 NVIDIA 收购) 担任过高效机器学习和深度学习的职位,拥有超过 10 年的经验 .Zhiyu 拥有超过 30 篇已发表的论文和专利。他拥有伊利诺伊大学电气和计算机工程博士学位,论文涉及信息理论领域。

Posts by Zhiyu Cheng

对话式人工智能

NVIDIA TensorRT 模型优化器 v0.15 提高推理性能扩展模型支持能力

NVIDIA 宣布推出新版 v0.15 NVIDIA TensorRT 模型优化器,这是一种先进的模型优化技术量化工具包,包含量化、 2 MIN READ
生成式人工智能/大语言模型

NVIDIA TensorRT 通过 8 位预训练量化将 Stable Diffusion 的速度提升近 2 倍

在生成式 AI 的动态领域,扩散模型脱颖而出,成为使用文本提示生成高质量图像的功能强大的架构 . 3 MIN READ