当涉及到高质量的合成语音开发和定制时,深度学习被证明是一个强大的工具。一家总部位于多伦多的初创公司, NVIDIA Inception 成员类似人工智能正在利用一种新的生成语音工具增加赌注,该工具能够创建高质量的合成人工智能语音。
这项技术可以在 50 多种最流行的语言中生成跨语言和自然说话的声音,通过相似填充,用户可以创建编程音频,编辑和替换音频片段中的单词。
构建、部署和扩展现实人工智能语音的能力将帮助众多行业。应用范围广泛,从为广告创建人工智能生成的文本,到交互式语音应答系统,再到视频游戏开发。
自 2020 年 7 月以来,相似人工智能团队与 NVIDIA 的对话人工智能团队密切合作,将 NVIDIA riva多模态对话人工智能 SDK 集成到他们的语音管道中。据人工智能创始人兼首席执行官佐哈伊布·艾哈迈德( Zohaib Ahmed )称,这种经历让他们在整个人工智能对话管道中融入了独特的 i NSight 。
“ NVIDIA Inception 计划有助于为对话人工智能领域提供关键 i NSight 以及为我们作为产品的每项工作推荐 GPU 计算提供技术支持,” Ahmed 说。
为了训练他们的语音模型和推理能力,该团队正在使用 Amazon 弹性 Kubernetes 服务( Amazon EKS )和 NVIDIA T4 GPU s 集群。然后,他们使用 NVIDIA Triton 推理服务器在生产中大规模部署他们训练有素的人工智能模型。
最近一个与 NVIDIA Omniverse Audio2Face集成的类似人工智能合成语音演示展示了组合技术如何从单一音频源创建富有表情的面部动画和声音。
Ahmed 说:“ Audio2Face 是一个很好的例子,它是一个强大的工具,可以很容易地与生成性人工智能语音相结合,在几秒钟内产生结果,否则需要几天时间。”。
公司 已经发展到拥有超过 150000 个用户,建立了超过 60000 个语音。迄今为止, 类似人工智能在电信、金融、通讯中心、教育、游戏、媒体和娱乐等行业拥有 240 多个付费客户。
你有创业公司吗?加入由 8500 多家初创公司组成的 NVIDIA Inception ‘全球网络。