语音 AI
2024年 9月 18日
使用 NVIDIA NIM 微服务实现语音和翻译功能,快速赋予应用语音能力
NVIDIA NIM 是 NVIDIA AI Enterprise 的一部分,为自行托管的 GPU 加速推理微服务提供容器,用于跨云、
3 MIN READ
2024年 9月 5日
跨音频类型实现先进的零样本波形音频生成
令人惊叹的音频内容是虚拟世界的重要组成部分。音频生成式 AI 在创建此类内容方面发挥着关键作用,NVIDIA 正在不断突破这一研究领域的极限。
2 MIN READ
2024年 7月 2日
NVIDIA NeMo T5-TTS 模型助力解决语音合成语言模型中的幻觉问题
NVIDIA NeMo 发布了 T5-TTS 模型,这是文本转语音 (TTS) 技术的一项重大进步。基于 大型语言模型 (LLM),
1 MIN READ
2024年 4月 18日
借助 NVIDIA NeMo Parakeet ASR 模型突破语音识别的界限
NVIDIA NeMo Parakeet 是一个端到端平台,用于在任何地方(任何云端和本地)大规模开发多模态生成式 AI 模型,
2 MIN READ
2024年 4月 18日
借助 NVIDIA NeMo Parakeet-TDT 提高 ASR 的准确性和速度
NVIDIA NeMo 是一个端到端平台,用于在任何云和本地的任何地方大规模开发多模式生成 AI 模型,最近发布了 Parakeet-TDT。
2 MIN READ
2024年 4月 18日
NVIDIA NeMo Canary 模型的语音识别和翻译新标准
NVIDIA NeMo 是一种端到端平台,用于开发和部署多模态 生成式 AI 模型。它可以随时随地进行大规模模型部署。
2 MIN READ
2024年 3月 19日
NVIDIA 语音和翻译 AI 模型在速度和准确性方面创下记录
NVIDIA 开发的语音和翻译 AI 模型正在推动性能和创新的发展。NVIDIA Parakeet 自动语音识别 (ASR) 模型系列以及…
2 MIN READ
2024年 1月 16日
NVIDIA NeMo ASR 发布了对荷兰语和波斯语的新支持
为了打破语音识别的障碍,NVIDIA NeMo自豪地推出了专为 AI 领域中常被忽视的荷兰语和波斯语设计的预训练模型。
1 MIN READ
2024年 1月 9日
使用 ASR 自定义增强电话客户服务
自动语音识别 (ASR) 是正确理解他人和进行自然对话的核心。为了打造客户主导的语音助手并通过电话实现客户服务交互自动化,公司必须通过理解、
2 MIN READ
2023年 12月 4日
在 NVIDIA ACE 中使用 AI 动画和语音功能打造逼真的虚拟形象
NVIDIA 今日公布了 NVIDIA Avatar Cloud Engine (ACE) 一系列技术,
1 MIN READ
2023年 11月 29日
借助 AI 驱动的记录和总结功能提高会议工作效率
会议是组织的生命线。它们促进协作和明智的决策。它们通过头脑风暴和解决问题来消除孤岛。它们还可以推进战略目标和规划。 然而,
1 MIN READ
2023年 11月 7日
视频:从研究到实际生产应用,探索语音 AI
将语音和翻译 AI 集成到我们的日常生活中,正在迅速重塑我们的互动方式(从虚拟助理到呼叫中心和增强现实体验)。语音 AI 日为语音 AI…
1 MIN READ
2023年 8月 29日
如何在公有云中部署 NVIDIA Riva 语音和翻译 AI
从初创企业到大型企业,企业都使用云市场来寻找快速转型所需的新解决方案。云市场是在线店面,客户可以在这里购买具有灵活计费模式的软件和服务,
5 MIN READ
2023年 6月 22日
零样本多扬声器 TTS 系统概述:热门问答
Speech AI Summit 是一个年度会议,汇集了人工智能和语音技术领域的专家,讨论最新的行业趋势和进步。这个会议的录音讲话,
1 MIN READ
2023年 6月 6日
为全球语言用户解锁语音 AI 技术:热门问答
语音技术正在无处不在地发展。但许多人正被一个以英语为中心、存在人口统计学偏见的算法世界抛在后面。
1 MIN READ
2023年 5月 30日
使用 NVIDIA 定制语音 AI 增强电信客户体验
电信行业正在改变通信方式。为了提供可靠、不间断的服务,企业正在应对提供最佳客户体验的挑战。
2 MIN READ