Posts by Disha Mehra
生成式人工智能/大语言模型
2024年 12月 18日
NVIDIA TensorRT-LLM 现支持 Recurrent Drafting,实现 LLM 推理优化
Recurrent Drafting (简称 ReDrafter) 是苹果公司为大语言模型 (LLM) 推理开发并开源的一种新型推测解码技术,
2 MIN READ
人工智能/深度学习
2021年 11月 9日
使用 NVIDIA TAO 工具包构建和部署对话 AI 模型
对话式人工智能是一组技术,能够在人类和设备之间基于最自然的界面(语音和自然语言)进行类似人类的交互。
7 MIN READ