Inception Spotlight：类似人工智能的合成语音

当涉及到高质量的合成语音开发和定制时，深度学习被证明是一个强大的工具。一家总部位于多伦多的初创公司， NVIDIA Inception 成员类似人工智能正在利用一种新的生成语音工具增加赌注，该工具能够创建高质量的合成人工智能语音。

这项技术可以在 50 多种最流行的语言中生成跨语言和自然说话的声音，通过相似填充，用户可以创建编程音频，编辑和替换音频片段中的单词。

构建、部署和扩展现实人工智能语音的能力将帮助众多行业。应用范围广泛，从为广告创建人工智能生成的文本，到交互式语音应答系统，再到视频游戏开发。

自 2020 年 7 月以来，相似人工智能团队与 NVIDIA 的对话人工智能团队密切合作，将 NVIDIA riva多模态对话人工智能 SDK 集成到他们的语音管道中。据人工智能创始人兼首席执行官佐哈伊布·艾哈迈德（ Zohaib Ahmed ）称，这种经历让他们在整个人工智能对话管道中融入了独特的 i NSight 。

“ NVIDIA Inception 计划有助于为对话人工智能领域提供关键 i NSight 以及为我们作为产品的每项工作推荐 GPU 计算提供技术支持，” Ahmed 说。

为了训练他们的语音模型和推理能力，该团队正在使用 Amazon 弹性 Kubernetes 服务（ Amazon EKS ）和 NVIDIA T4 GPU s 集群。然后，他们使用 NVIDIA Triton 推理服务器在生产中大规模部署他们训练有素的人工智能模型。

最近一个与 NVIDIA Omniverse Audio2Face集成的类似人工智能合成语音演示展示了组合技术如何从单一音频源创建富有表情的面部动画和声音。