Author:

季光

NVIDIA GPU 加速计算专家团队经理 NVIDIA DevTech 团队经理，博士毕业于中科院计算所。擅长 GPU 加速的视频处理以及性能优化，以及深度学习模型的推理优化，在 GPU 视频编解码以及 CUDA 编程与优化方面积累了丰富的经验。

人工智能/深度学习 2023年 12月 4日

大型语言模型正以其惊人的新能力推动人工智能的发展，扩大其应用范围。然而，由于这类模型具有庞大的参数规模，部署和推理的难度和成本极高， 2 MIN READ