Posts by Neal Vaidya
生成式人工智能/大语言模型
2024年 6月 7日
借助 NVIDIA NIM 无缝部署大量 LoRA Adapters
最新的先进基础大型语言模型 (LLM) 拥有数十亿个参数,并已在数万亿个输入文本标记上进行了预训练。它们通常在各种用例上都取得了惊人的成果,
2 MIN READ
生成式人工智能/大语言模型
2024年 4月 22日
借助 NVIDIA TensorRT-LLM 和 NVIDIA Triton 推理服务器提升 Meta Llama 3 性能
我们很高兴地宣布支持 Meta Llama 3 系列模型,通过 NVIDIA TensorRT LLM 加速和优化 LLM 推理性能。
2 MIN READ
数据中心/云端
2024年 3月 18日
NVIDIA NIM 提供经过优化的推理微服务,用于大规模部署 AI 模型
数字生成的生成式 AI 采用率一直很高。在 2022 年推出 OpenAI 聊天 GPT 的推动下,
2 MIN READ
对话式人工智能
2023年 11月 17日
掌握 LLM 技术:推理优化
通过堆叠 Transformer 层来创建大型模型,可以提高准确性、实现少量学习功能,并且在各种语言任务中实现近乎人类的性能。
4 MIN READ
数据中心/云端
2023年 11月 15日
NVIDIA AI Foundation 模型:使用生产就绪型 LLM 构建自定义企业聊天机器人和 Co-Pilot
大型语言模型(LLM)正在革新数据科学领域,特别是在自然语言理解、AI 以及 机器学习 方面。
3 MIN READ
生成式人工智能/大语言模型
2023年 10月 19日
现已公开发布!欢迎使用 NVIDIA TensorRT-LLM 优化大语言模型推理
NVIDIA 于 2023 年 10 月 19 日公开发布 TensorRT-LLM,
3 MIN READ