会话 AI / NLP
2023年 10月 11日
宣布推出 SteerLM:在推理期间自定义 LLM 的简单实用技术
近年来,随着大语言模型 (LLMs)例如 GPT-3、Megatron-Turing、Chinchilla、PaLM-2、
3 MIN READ
2023年 10月 2日
加速向量搜索:RAPIDS RAFT IVF-Flat 近似算法
执行详尽的精确 k 最近邻 (kNN) 搜索,也称为暴力搜索,成本高昂,并且它不能很好地扩展到更大的数据集。在向量搜索期间,
3 MIN READ
2023年 9月 12日
使用 NVIDIA Triton 管理服务扩展深度学习部署
组织正在以前所未有的速度将机器学习(ML)集成到整个系统和产品中。他们正在寻找解决方案,以帮助处理在生产规模部署模型的复杂性。
2 MIN READ
2023年 9月 11日
加速矢量搜索:微调 GPU 索引算法
这个 系列的第一篇文章 介绍了矢量搜索索引,解释了它们在实现广泛的重要应用中所起的作用,并使用了 RAFT 库。 在这篇文章中,
2 MIN READ
2023年 9月 1日
用蒸馏法加速文本到语音的扩散模型
每年,作为课程的一部分,波兰华沙大学的学生都会在 NVIDIA 华沙办事处工程师的监督下,就深度学习和加速计算中的挑战性问题开展工作。
2 MIN READ
2023年 8月 29日
如何在公有云中部署 NVIDIA Riva 语音和翻译 AI
从初创企业到大型企业,企业都使用云市场来寻找快速转型所需的新解决方案。云市场是在线店面,客户可以在这里购买具有灵活计费模式的软件和服务,
5 MIN READ
2023年 8月 10日
选择大型语言模型定制技术
大语言模型(LLM)正在成为企业不可或缺的工具,用于改善他们的运营、客户互动和决策过程。然而,由于行业特定的术语、领域专业知识或独特的要求,
3 MIN READ
2023年 8月 8日
使用 NVIDIA AI Workbench 无缝开发和部署可扩展的生成式 AI 模型
开发自定义 生成式人工智能 模型和应用程序是一段旅程,而不仅仅是一个目标。这个过程从选择一个预训练的模型开始,例如 大语言模型,
3 MIN READ
2023年 8月 8日
策展万亿代币数据集: NVIDIA NeMo 数据策展人介绍
这个大型语言模型 (LLM) 缩放规律的最新发展已经表明,当模型参数的数量进行缩放时,用于训练的令牌的数量也应该以相同的速率进行缩放。
2 MIN READ
2023年 8月 8日
借助 NVIDIA NeMo 解锁企业级 LLM 的力量
生成式人工智能开启了一个新的计算时代,这个时代有望彻底改变人机交互。这一技术的前沿是大语言模型 (LLMs),
2 MIN READ
2023年 8月 4日
缓解针对 LLM 应用程序的存储提示注入攻击
Large Language Model (LLM) 的应用程序安全性中存在即时注入攻击。这些攻击是独特的,因为恶意文本会被存储在系统中。
2 MIN READ
2023年 7月 10日
使用分布式数据集上的联合学习使 LLM 适应下游任务
大型语言模型( LLM ),如 GPT,由于其理解和生成类人文本的能力,已成为自然语言处理( NLP )中的革命性工具。
2 MIN READ
2023年 7月 3日
NVIDIA Ampere 架构的结构化稀疏功能及其在搜索引擎中的应用
深度学习彻底改变了我们分析、理解和处理数据的方式,而且在各个领域的应用中都取得了巨大的成功,其在计算机视觉、自然语言处理、医疗诊断和医疗保健、
4 MIN READ
2023年 6月 28日
如何使用 PyTriton 在 Python 中部署 AI 模型
人工智能模型无处不在,形式包括聊天机器人、分类和摘要工具、用于分割和检测的图像模型、推荐模型等。人工智能机器学习( ML…
2 MIN READ
2023年 6月 23日
语音 AI 聚焦:在 AR 眼镜上可视化口语和声音
音频可以包括各种各样的声音,从人类的语音到狗叫声和警笛声等非语音。当为听力困难的人设计可访问的应用程序时,
1 MIN READ
2023年 6月 22日
零样本多扬声器 TTS 系统概述:热门问答
Speech AI Summit 是一个年度会议,汇集了人工智能和语音技术领域的专家,讨论最新的行业趋势和进步。这个会议的录音讲话,
1 MIN READ