Posts by Brian Slechta
数据中心/云端
2024年 8月 12日
NVIDIA NVLink 和 NVIDIA NVSwitch 加速大语言模型推理性能
大型语言模型(LLM)越来越大,增加了处理推理请求所需的计算量。为了满足服务当今LLM的实时延迟要求,并为尽可能多的用户提供服务,
3 MIN READ
数据中心/云端
2024年 6月 12日
揭开万亿参数大型语言模型 AI 推理部署的神秘面纱
人工智能(AI)正在改变各行各业,解决精准药物发现、自动驾驶汽车开发等重大人类科学挑战,
4 MIN READ