高慧怡

NVIDIA 深度学习解决方案架构师 2020 年加入 NVIDIA 解决方案架构团队,从事深度学习应用在异构系统的加速工作,目前主要支持国内 CSP 客户在大语言模型的训练加速工作。

Posts by 高慧怡

加速计算

探索 FP8 训练中 Debug 思路与技巧

目前,市场上许多公司都积极开展基于 FP8 的大模型训练,以提高计算效率和性能。 在此, 2 MIN READ
生成式人工智能/大语言模型

阿里安全使用 NVIDIA NeMo 框架和 TensorRT-LLM 的大模型工程化落地实践

随着 ChatGPT 的一夜爆火,大模型如今越来越广泛的应用到各种业务领域中,阿里安全的业务领域对大模型技术的应用也已经 2 年有余。 4 MIN READ
加速计算

NVIDIA GPU 架构下的 FP8 训练与推理

本文聚焦 NVIDIA FP8 训练与推理的实践应用,该内容来源于 2023 云栖大会 NVIDIA 专场演讲。 FP8 训练利用 E5M2/ 5 MIN READ