NVIDIA NeMo

O NVIDIA NeMo é um kit de ferramentas de código aberto para o desenvolvimento de modelos de AI conversacional de última geração.


Faça Download Agora



O desenvolvimento de modelos de AI conversacional de última geração exige que os pesquisadores experimentem rapidamente novas arquiteturas de rede. Isso significa passar pelo processo complexo e demorado de modificar várias redes e verificar a compatibilidade entre entradas, saídas e camadas de pré-processamento de dados.

O NVIDIA NeMo é um kit de ferramentas Python para desenvolver, treinar e ajustar modelos de AI conversacional acelerados por GPU usando uma interface simples. Com o NeMo, pesquisadores e desenvolvedores podem criar modelos de AI conversacional de última geração usando interfaces de programação de aplicações (APIs) fáceis de usar. O NeMo executa computação de precisão mista usando Tensor Cores em GPUs NVIDIA e pode ser facilmente expandido para várias GPUs para oferecer o melhor desempenho de treinamento possível.

O NeMo é usado para criar modelos para aplicações de reconhecimento de fala automatizada (ASR - Automated Speech Recognition) em tempo real, processamento de linguagem natural (NLP - Natural Language Processing) e conversão de texto em fala (TTS - Text-to-Speech), como transcrições de chamadas de vídeo, assistentes de vídeo inteligentes e suporte automatizado para call centers nas áreas da saúde, finanças, varejo e telecomunicações.



Desenvolvimento Rápido de Modelos

Configure, desenvolva e treine modelos rapidamente com APIs Python simples.

Modelos personalizáveis

Faça o download e personalize modelos pré-treinados de última geração do NGC.

Amplamente Integrado

Interoperável com o ecossistema PyTorch e PyTorch Lightning.

Fácil Implantação

Aplique otimizações do NVIDIA® TensorRT™ para inferência e exporte para o NVIDIA Jarvis com um único comando.



Integrações Populares de Frameworks

PyTorch

NeMo foi desenvolvido com base no framework popular PyTorch e facilita os pesquisadores a usar os módulos NeMo com as aplicações PyTorch

Saiba Mais

PyTorch Lightning

NeMo com Pytorch Lightning permite um treinamento de precisão mista multi-GPU / multi-nó fácil e de alto desempenho


Saiba Mais

Hydra

Hydra é uma solução flexível que permite aos pesquisadores configurar módulos e modelos NeMo rapidamente a partir de um arquivo de configuração e linha de comando.

Saiba Mais

DataSaur

A integração do DataSaur com o kit de ferramentas NeMo transforma facilmente os dados brutos em um modelo de AI de conversação totalmente desenvolvido.


Saiba Mais



"Ping An atende a milhões de consultas de clientes todos os dias usando agentes de chat-bot. Como um dos primeiros parceiros do programa de acesso antecipado Jarvis, fomos capazes de usar as ferramentas e construir soluções melhores com maior precisão e menor latência, fornecendo assim melhores serviços. Mais especificamente, com o NeMo, o modelo pré-treinado, e o pipeline ASR otimizado com Jarvis, o sistema obteve 5% de melhoria na precisão, de forma a atender nossos clientes com melhor experiência."


— Dr. Jing Xiao, Cientista-Chefe da Ping An ping am

"Em nossa avaliação do Jarvis para assistentes virtuais e análise de fala, vimos uma precisão notável ao ajustar os modelos de Reconhecimento Automatizado de Fala no idioma russo usando o kit de ferramentas NeMo em Jarvis. Jarvis pode fornecer até 10 vezes de desempenho de rendimento com otimizações potentes do TensorRT em modelos, então estamos ansiosos para usar Jarvis para obter o máximo desses avanços tecnológicos.”


— Nikita Semenov, Chefe de ML no MTS AI mts

“A InstaDeep oferece produtos e soluções de AI de tomada de decisão para empresas. Para este projeto, nosso objetivo é construir um assistente virtual na língua árabe, e NVIDIA Jarvis desempenhou um papel significativo na melhoria do desempenho da aplicação. Usando o kit de ferramentas NeMo no Jarvis, pudemos ajustar um modelo de fala para texto em árabe para obter uma taxa de erro de palavras tão baixa quanto 7,84% e reduzimos o tempo de treinamento do modelo de dias para horas usando as GPUs. Esperamos integrar esses modelos no pipeline de ponta a ponta do Jarvis para garantir latência em tempo real.”

— Karim Beguir, CEO e Cofundador da InstaDeep instadeep

“Por meio do programa de acesso antecipado do NVIDIA Jarvis, pudemos potencializar nossos produtos de AI de conversação com modelos de última geração usando NVIDIA NeMo, reduzindo significativamente o custo inicial. O reconhecimento de voz do Jarvis tem latência incrivelmente baixa e alta precisão. Ter a flexibilidade para implantar no local e oferecer uma variedade de opções de privacidade e segurança de dados para nossos clientes nos ajudou a posicionar nossos produtos habilitados para AI de conversação em novos setores da indústria.”

— Rajesh Jha, CEO da Siminsights. siminsights

"Na MeetKai, criamos assistentes virtuais que facilitam a vida das pessoas. Quando começamos nossa empresa, enfrentamos desafios de engenharia e produção porque não havia muitos kits de ferramentas de AI de conversação de código aberto e de alta qualidade. O NVIDIA NeMo ajudou nossos esforços de engenharia ao fornecendo APIs fáceis de usar e reduzindo nossos custos em 25%. Esperamos continuar a trabalhar com o NeMo para criar o auxiliar de IA definitivo.”

— James Kalpan, CEO da MeetKai meetkai

“Kensho alavanca os dados e pesquisas de classe mundial da S&P Global para construir ferramentas incríveis que ajudam as pessoas a tomar decisões baseadas em fatos. Usando NVIDIA NeMo em GPUs, Kensho transcreveu com sucesso dezenas de milhares de chamadas de ganhos, apresentações de gerenciamento e chamadas de aquisição, desbloqueando melhorias de precisão de dois dígitos e permitindo que a S&P Global aumentasse a cobertura de chamadas de lucros em mais de 25%.”


— Keenan Freyberg, Gerente de Produto na Kensho kensho

“Nosso objetivo com o SpeechBrain no MILA é construir um kit de ferramentas completo que pode acelerar significativamente a pesquisa e o desenvolvimento de modelos de fala. Estamos interessados em expandir ainda mais os limites das tecnologias de fala integrando-nos aos módulos NeMo, principalmente reconhecimento de fala e modelagem de linguagem.”



— Mirco Ravanelli, Cientista da Fala e Deep Learning na MILA MILA



Componha Facilmente Novas Arquiteturas de Modelos


O NeMo inclui coleções específicas de domínio de ASR, NLP e TTS para desenvolver modelos de última geração, como QuartzNet, Jasper, BERT, Tacotron2 e WaveGlow, em três linhas de código. O modelo NeMo é composto por Módulos Neurais, que são os blocos de construção dos modelos. As entradas e saídas desses módulos são fortemente tipadas com tipos neurais que podem executar automaticamente as verificações semânticas entre os módulos.

O NeMo foi projetado para oferecer alta flexibilidade, e você pode usar o framework Hydra para modificar o comportamento dos modelos com facilidade. Por exemplo, é possível modificar a arquitetura do módulo Jasper Encoder no diagrama a seguir usando o Hydra.

Figura 1: Pipeline de ASR usando módulos NeMo


Retreine Modelos de AI Conversacional de Última Geração


Figura 2: Modelos pré-treinados altamente precisos

Vários modelos NeMo pré-treinados de última geração estão disponíveis no NGC, treinados por mais de 100 mil horas no NVIDIA DGX™ em conjuntos de dados abertos e proprietários. Você pode ajustar esses modelos ou modificá-los com o NeMo antes de treiná-los para seu caso de uso.

O NeMo usa precisão mista nos Tensor Cores para acelerar o treinamento em até 4,5 vezes em uma única GPU em comparação com a precisão do FP32. Você pode dimensionar ainda mais o treinamento para sistemas com várias GPUs e clusters com vários nós.



Ecossistema Flexível, de Código Aberto e Rápida Expansão


O NeMo foi desenvolvido com base em PyTorch e PyTorch Lightning, oferecendo um caminho fácil para os pesquisadores desenvolverem e integrarem com módulos com os quais já estão familiarizados. O PyTorch e o PyTorch Lightning são bibliotecas Python de código aberto que fornecem módulos para compor modelos.

Para oferecer aos pesquisadores a flexibilidade para personalizar os modelos/módulos com facilidade, o NeMo foi integrado ao framework Hydra. O Hydra é um framework popular que simplifica o desenvolvimento de modelos de AI conversacional complexos.

O NeMo está disponível como código aberto para que os pesquisadores possam contribuir e desenvolvê-lo.

Figura 3: Integração do NeMo com PyTorch e PyTorch Lightning


Implante em Serviços em Tempo Real


Figura 4: Integração do NeMo com o Jarvis

Os modelos NeMo podem ser facilmente exportados para os serviços do NVIDIA Jarvis para inferência de alto desempenho com um único comando. Você pode exportar modelos em ONNX, PyTorch e TorchScript.

O Jarvis aplica otimizações avançadas do TensorRT e configura o serviço para que você possa acessar esses modelos por meio de uma API padrão.



Amplamente Adotado



Recursos


Introdução aos Tutoriais


Confira os tutoriais para começar a trabalhar rapidamente com modelos de fala e linguagem de última geração.


Saiba Mais

Faça um Tour pelo NeMo


Entenda as vantagens de usar NVIDIA NeMo em um passo a passo com o Notebook Jupyter.


Leia o Blog

Crie Aplicações de AI de Conversação

Aprenda a construir e ajustar os serviços ASR, NLP e TTS com NVIDIA NeMo e Jarvis.


Assista ao Webinar

Veja Mais Blogs de AI de Conversação

Mantenha-se atualizado aprendendo as novidades e novidades da AI de conversação.


Veja os Blogs



O NeMo está disponível para download no NGC. Você também pode fazer o download com o comando de instalação pip e o contêiner do Docker a partir do repositório GitHub do NeMo


Faça Download Agora