大型语言模型( LLMs )
2023年 10月 12日
适用于数据中心和 AI 时代的网络
十多年来,传统的云数据中心一直是计算基础设施的基石,满足了各种用户和应用程序的需求。然而,近年来,
1 MIN READ
2023年 10月 11日
宣布推出 SteerLM:在推理期间自定义 LLM 的简单实用技术
近年来,随着大语言模型 (LLMs)例如 GPT-3、Megatron-Turing、Chinchilla、PaLM-2、
3 MIN READ
2023年 9月 11日
NVIDIA GH200 Grace Hopper 超级芯片首次亮相,取得领先的 MLPerf 推理 v3.1 结果
人工智能正在改变计算方式,推动AI在全球范围内的应用部署。智能聊天机器人、图像和视频合成的简单文本提示、
4 MIN READ
2023年 9月 8日
NVIDIA TensorRT-LLM 在 NVIDIA H100 GPU 上大幅提升大语言模型推理能力
大语言模型(LLM)提供异常强大的新功能,拓展了 AI 的应用领域。但由于其庞大的规模和独特的执行特性,很难找到经济高效的使用方式。
3 MIN READ
2023年 8月 29日
在 GPU 加速的 Google Cloud 上使用 NVIDIA NeMo 简化生成式 AI 开发
生成式人工智能已成为我们时代的变革力量,使各行各业的组织能够实现无与伦比的生产力水平,提升客户体验,并提供卓越的运营效率。
2 MIN READ
2023年 8月 10日
选择大型语言模型定制技术
大语言模型(LLM)正在成为企业不可或缺的工具,用于改善他们的运营、客户互动和决策过程。然而,由于行业特定的术语、领域专业知识或独特的要求,
3 MIN READ
2023年 8月 8日
使用 NVIDIA AI Workbench 无缝开发和部署可扩展的生成式 AI 模型
开发自定义 生成式人工智能 模型和应用程序是一段旅程,而不仅仅是一个目标。这个过程从选择一个预训练的模型开始,例如 大语言模型,
3 MIN READ
2023年 8月 4日
缓解针对 LLM 应用程序的存储提示注入攻击
Large Language Model (LLM) 的应用程序安全性中存在即时注入攻击。这些攻击是独特的,因为恶意文本会被存储在系统中。
2 MIN READ
2023年 8月 3日
保护 LLM 系统不受即时注入的影响
即时注入是一种新的攻击技术,专门针对 大语言模型 (LLMs),使得攻击者能够操纵 LLM 的输出。由于 LLM 越来越多地配备了“插件”,
3 MIN READ
2023年 7月 10日
使用分布式数据集上的联合学习使 LLM 适应下游任务
大型语言模型( LLM ),如 GPT,由于其理解和生成类人文本的能力,已成为自然语言处理( NLP )中的革命性工具。
2 MIN READ
2023年 6月 14日
如何从大型语言模型中获得更好的输出
大语言模型(LLM)因其前所未有的规模理解和处理人类语言的能力,在全球引发轰动,改变了我们与技术互动的方式。 经过大量文本语料库的训练,
3 MIN READ
2023年 6月 14日
借助 NVIDIA FLARE 实现的联合学习,提升您的人工智能工作流程
在工作流程中利用人工智能的企业面临的主要挑战之一是管理支持大规模培训和部署机器学习( ML )模型所需的基础设施。为此,
2 MIN READ
2023年 5月 29日
使用 NVIDIA Spectrum-X 网络平台进行涡轮增压生成 AI 工作负载
大型语言模型( LLM )和人工智能应用程序,如ChatGPT和 DALL-E 最近出现了快速增长。由于 GPU 、 CPU 、 DPU 、
2 MIN READ
2023年 5月 26日
人工智能推动科学计算革命
AI 及其最新子域,生成式人工智能正在显著加快科学计算研究。从药物和材料科学到天文学,这项改变游戏规则的技术正在开辟新的可能性,
2 MIN READ
2023年 5月 15日
使用 Alpa 和 Ray 在大型 GPU 集群中高效扩展 LLM 训练
近年来,大型语言模型( LLM )的数量激增,它们超越了传统的语言任务,扩展到生成式人工智能这包括像 ChatGPT 和 Stable…
4 MIN READ
2023年 4月 25日
NVIDIA 实现值得信赖、安全可靠的大型语言模型对话系统
大语言模型( LLM )非常强大,能够回答复杂的问题,进行创造性的写作、开发、调试源代码等。通过将 LLM 应用程序连接到外部工具,
1 MIN READ