NVIDIA NeMo

O NVIDIA NeMo é um kit de ferramentas de código aberto para o desenvolvimento de modelos de AI conversacional de última geração.

Faça Download Agora

O desenvolvimento de modelos de AI conversacional de última geração exige que os pesquisadores experimentem rapidamente novas arquiteturas de rede. Isso significa passar pelo processo complexo e demorado de modificar várias redes e verificar a compatibilidade entre entradas, saídas e camadas de pré-processamento de dados.

O NVIDIA NeMo é um kit de ferramentas Python para desenvolver, treinar e ajustar modelos de AI conversacional acelerados por GPU usando uma interface simples. Com o NeMo, pesquisadores e desenvolvedores podem criar modelos de AI conversacional de última geração usando interfaces de programação de aplicações (APIs) fáceis de usar. O NeMo executa computação de precisão mista usando Tensor Cores em GPUs NVIDIA e pode ser facilmente expandido para várias GPUs para oferecer o melhor desempenho de treinamento possível.

O NeMo é usado para criar modelos para aplicações de reconhecimento de fala automatizada (ASR - Automated Speech Recognition) em tempo real, processamento de linguagem natural (NLP - Natural Language Processing) e conversão de texto em fala (TTS - Text-to-Speech), como transcrições de chamadas de vídeo, assistentes de vídeo inteligentes e suporte automatizado para call centers nas áreas da saúde, finanças, varejo e telecomunicações.

Desenvolvimento Rápido de Modelos

Configure, desenvolva e treine modelos rapidamente com APIs Python simples.

Modelos personalizáveis

Faça o download e personalize modelos pré-treinados de última geração do NGC.

Amplamente Integrado

Interoperável com o ecossistema PyTorch e PyTorch Lightning.

Fácil Implantação

Aplique otimizações do NVIDIA® TensorRT™ para inferência e exporte para o NVIDIA Riva com um único comando.

Integrações Populares de Frameworks

PyTorch

NeMo foi desenvolvido com base no framework popular PyTorch e facilita os pesquisadores a usar os módulos NeMo com as aplicações PyTorch

Saiba Mais

PyTorch Lightning

NeMo com Pytorch Lightning permite um treinamento de precisão mista multi-GPU / multi-nó fácil e de alto desempenho

Saiba Mais

Hydra

Hydra é uma solução flexível que permite aos pesquisadores configurar módulos e modelos NeMo rapidamente a partir de um arquivo de configuração e linha de comando.

Saiba Mais

DataSaur

A integração do DataSaur com o kit de ferramentas NeMo transforma facilmente os dados brutos em um modelo de AI de conversação totalmente desenvolvido.

Saiba Mais

"Ping An atende a milhões de consultas de clientes todos os dias usando agentes de chat-bot. Como um dos primeiros parceiros do programa de acesso antecipado Riva, fomos capazes de usar as ferramentas e construir soluções melhores com maior precisão e menor latência, fornecendo assim melhores serviços. Mais especificamente, com o NeMo, o modelo pré-treinado, e o pipeline ASR otimizado com Riva, o sistema obteve 5% de melhoria na precisão, de forma a atender nossos clientes com melhor experiência."

— Dr. Jing Xiao, Cientista-Chefe da Ping An

Componha Facilmente Novas Arquiteturas de Modelos

O NeMo inclui coleções específicas de domínio de ASR, NLP e TTS para desenvolver modelos de última geração, como QuartzNet, Jasper, BERT, Tacotron2 e WaveGlow, em três linhas de código. O modelo NeMo é composto por Módulos Neurais, que são os blocos de construção dos modelos. As entradas e saídas desses módulos são fortemente tipadas com tipos neurais que podem executar automaticamente as verificações semânticas entre os módulos.

O NeMo foi projetado para oferecer alta flexibilidade, e você pode usar o framework Hydra para modificar o comportamento dos modelos com facilidade. Por exemplo, é possível modificar a arquitetura do módulo Jasper Encoder no diagrama a seguir usando o Hydra.

Figura 1: Pipeline de ASR usando módulos NeMo

Retreine Modelos de AI Conversacional de Última Geração

Figura 2: Modelos pré-treinados altamente precisos

Vários modelos NeMo pré-treinados de última geração estão disponíveis no NGC, treinados por mais de 100 mil horas no NVIDIA DGX™ em conjuntos de dados abertos e proprietários. Você pode ajustar esses modelos ou modificá-los com o NeMo antes de treiná-los para seu caso de uso.

O NeMo usa precisão mista nos Tensor Cores para acelerar o treinamento em até 4,5 vezes em uma única GPU em comparação com a precisão do FP32. Você pode dimensionar ainda mais o treinamento para sistemas com várias GPUs e clusters com vários nós.

Ecossistema Flexível, de Código Aberto e Rápida Expansão

O NeMo foi desenvolvido com base em PyTorch e PyTorch Lightning, oferecendo um caminho fácil para os pesquisadores desenvolverem e integrarem com módulos com os quais já estão familiarizados. O PyTorch e o PyTorch Lightning são bibliotecas Python de código aberto que fornecem módulos para compor modelos.

Para oferecer aos pesquisadores a flexibilidade para personalizar os modelos/módulos com facilidade, o NeMo foi integrado ao framework Hydra. O Hydra é um framework popular que simplifica o desenvolvimento de modelos de AI conversacional complexos.

O NeMo está disponível como código aberto para que os pesquisadores possam contribuir e desenvolvê-lo.

Figura 3: Integração do NeMo com PyTorch e PyTorch Lightning

Implante em Serviços em Tempo Real

Figura 4: Integração do NeMo com o Riva

Os modelos NeMo podem ser facilmente exportados para os serviços do NVIDIA Riva para inferência de alto desempenho com um único comando. Você pode exportar modelos em ONNX, PyTorch e TorchScript.

O Riva aplica otimizações avançadas do TensorRT e configura o serviço para que você possa acessar esses modelos por meio de uma API padrão.

Amplamente Adotado

Recursos

Introdução aos Tutoriais

Confira os tutoriais para começar a trabalhar rapidamente com modelos de fala e linguagem de última geração.

Saiba Mais

Faça um Tour pelo NeMo

Entenda as vantagens de usar NVIDIA NeMo em um passo a passo com o Notebook Jupyter.

Leia o Blog

Crie Aplicações de AI de Conversação

Aprenda a construir e ajustar os serviços ASR, NLP e TTS com NVIDIA NeMo e Riva.

Assista ao Webinar

Veja Mais Blogs de AI de Conversação

Mantenha-se atualizado aprendendo as novidades e novidades da AI de conversação.

Veja os Blogs

O NeMo está disponível para download no NGC. Você também pode fazer o download com o comando de instalação pip e o contêiner do Docker a partir do repositório GitHub do NeMo

Faça Download Agora