对话式人工智能/自然语言处理

NVIDIA GTC 2022 年大会上宣布了 NVIDIA AI 软件的主要更新,包括语音推进、推荐、推理等

在 GTC 2022 年,NVIDIA 宣布对其NVIDIA 人工智能软件套件进行重大更新,以供开发人员构建实时语音人工智能应用程序,大规模创建高性能推荐程序,并在每个应用程序中优化推理,等等。观看首席执行官 Jensen Huang 的 keynote ,了解 Nvidia 的最新进展。


宣布 NVIDIA Riva 2.0

今天,NVIDIA 宣布 Riva 2.0 正式上市。 Riva 是一款加速语音 AI SDK ,为实时应用程序提供模型、工具、完全优化的语音识别和文本到语音管道。

亮点包括:

  • 七种语言的世界级自动语音识别。
  • 基于神经的文本到语音转换,生成高质量的人声。
  • 使用 TAO 工具包和 NeMo 进行特定领域的定制。
  • 支持在云端、 prem 和嵌入式平台上运行。

NVIDIA 也宣布 Riva 企业 ,为大规模部署的企业提供访问 NVIDIA 语音专家的机会。企业可以 在 LaunchPad 中的现成基础设施上使用引导实验室试用 Riva

将此 GTC 会话添加到您的日历以了解更多信息:


宣布推出 NVIDIA Merlin 1.0 超大规模 ML 、 DL 推荐系统

今天, NVIDIA 发布了 NVIDIA Merlin 1.0 ,这是一个端到端的框架,旨在加速推荐者的工作流程,包括数据预处理、功能转换、培训、优化和部署。有了最新版本的 NVIDIA Merlin ,数据科学家和机器学习工程师可以用更少的代码更快地扩展。新功能提供了对功能、模型的快速迭代,以及部署经过充分训练的推荐程序管道,将功能转换、检索和排名模型作为推理微服务。

亮点包括:

  • Merlin Models 是一个新的库,数据科学家可以用不到 50 行代码来训练和部署推荐模型。
  • Merlin Systems 是一个新的库,机器学习工程师可以轻松地将推荐程序管道部署为集成的 Triton 微服务。
  • 支持大规模多 GPU 、多节点推理和计算密集度较低的工作负载。

有关最新版本的更多信息,请下载并尝试 NVIDIA Merlin

将这些 GTC 会话添加到您的日历中以了解更多信息:


宣布NVIDIA Triton 的新功能

今天,NVIDIA 宣布对 NVIDIA Triton 进行新的关键更新。 Triton 是一款开源推理服务软件,为生产中的每个应用程序提供快速、可扩展的人工智能。

亮点包括:

  • Triton FIL 后端:使用 Shapley 值和 CPU 优化来解释模型,以获得更好的性能。
  • Triton 管理服务,简化并自动化 Kubernetes 上 Triton 实例群的设置和管理。 Alpha 发布计划在 3 月底发布。
  • Triton Model Navigator 可自动为 Triton ®声波风廓线仪的生产部署准备训练有素的模型。
  • Fleet Command 集成用于边缘部署。
  • 支持 AWS 推理和 MLFlow 插件上的推理,以部署 MLFlow 模型。
  • 无需设置自己的 Triton 环境,即可在 NVIDIA LaunchPad 中立即、短期访问 Triton 之旅。

您可以从 NGC catalog 下载 Triton ,并访问 GitHub 上的代码和文档。

将这些 GTC 会话添加到您的日历中以了解更多信息:


宣布NVIDIA NeMo 威震天的新更新

今天,NVIDIA 发布了最新版本的 NVIDIA NeMo Megatron ,一个用于训练大型语言模型( LLM )的框架有了 NeMo Megatron ,研究机构和企业可以为任何法学硕士提供最快的培训。它还包括最新的并行技术、数据预处理脚本和确保训练收敛的方法。

亮点包括:

  • 超参数优化工具,可根据客户需求和基础设施限制自动创建配方。
  • T5 和 mT5 车型的参考配方。
  • Azure 的云支持。
  • 分布式数据预处理脚本,缩短端到端培训时间。

点击 此处 申请提前访问。

将这些 GTC 会话添加到您的日历中以了解更多信息:


宣布 NVIDIA Maxine 的新功能

今天,NVIDIA 宣布了 NVIDIA Maxine 的最新版本,这是一套 GPU 加速的 SDK ,通过人工智能重塑音频和视频通信,提升标准麦克风和摄像头,实现清晰的在线通信。 Maxine 提供最先进的实时人工智能音频、视频和增强现实功能,这些功能可以内置到可定制的端到端深度学习管道中。

亮点包括:

  • 音频超分辨率:通过将音频输入流从 8kHz 上采样到 16kHz ,并从 16kHz 上采样到 48kHz ,提高实时音频质量。
  • 声学回波消除:从输入音频流中消除实时声学设备回波,消除不匹配的声学对和双重通话。与传统的数字信号处理相比,基于人工智能的技术可以实现更有效的对消。
  • 噪音消除:使用最先进的人工智能模型消除几种常见的背景噪音,同时保留说话者的自然声音。
  • 房间回声消除:使用最先进的人工智能模型消除音频中的混响,恢复说话者声音的清晰度。

现在下载 NVIDIA Maxine .

将这些 GTC 会话添加到您的日历中以了解更多信息:

现在注册 GTC ,了解更多关于 GPU 加速人工智能技术的最新更新。

 

Tags