Bita Darvish Rouhani

Bita Darvish Rouhani 是 NVIDIA 的杰出工程师兼经理,在成本优化的生成式 AI 推理方面领导算法、软件和硬件联合设计计划。在加入 NVIDIA 之前,Bita 是 Microsoft 的合作伙伴组经理,她与他人共同创立并领导了 OCP MX 联盟。该联盟已将第一组 4 位和 6 位数据类型标准化,用于几乎所有主流 AI 芯片的 AI 训练和推理。Bita 拥有加州大学圣地亚哥分校的计算机工程博士学位。

Posts by Bita Darvish Rouhani

数据科学

提出一个维基百科规模的问题:如何利用数百万 token 的实时推理使世界更加智能

现代 AI 应用越来越依赖于将庞大的参数数量与数百万个令牌的上下文窗口相结合的模型。无论是经过数月对话的 AI 智能体、 3 MIN READ
AI 平台/部署

NVIDIA GB200 NVL72 和 NVIDIA Dynamo 如何提升 MoE 模型的推理性能

最新一批开源大语言模型 (LLMs) 采用了 Mixture of Experts (MoE) 架构,如 DeepSeek R1、 4 MIN READ