Posts by Somshubra Majumdar
对话式人工智能
2024年 4月 18日
借助 NVIDIA NeMo Parakeet ASR 模型突破语音识别的界限
NVIDIA NeMo Parakeet 是一个端到端平台,用于在任何地方(任何云端和本地)大规模开发多模态生成式 AI 模型,
2 MIN READ
对话式人工智能
2024年 4月 18日
借助 NVIDIA NeMo Parakeet-TDT 提高 ASR 的准确性和速度
NVIDIA NeMo 是一个端到端平台,用于在任何云和本地的任何地方大规模开发多模式生成 AI 模型,最近发布了 Parakeet-TDT。
2 MIN READ
对话式人工智能
2024年 3月 19日
NVIDIA 语音和翻译 AI 模型在速度和准确性方面创下记录
NVIDIA 开发的语音和翻译 AI 模型正在推动性能和创新的发展。NVIDIA Parakeet 自动语音识别 (ASR) 模型系列以及…
2 MIN READ
对话式人工智能/自然语言处理
2023年 2月 3日
语音识别模型对新领域的受控适应
你有没有试过在你的口音上微调语音识别系统,结果发现,虽然它能很好地识别你的声音,但却无法检测到别人说的话?
2 MIN READ
对话式人工智能
2022年 9月 12日
结合卷积和注意机制改进日语 ASR
自动语音识别( ASR )研究通常侧重于高资源语言,如英语,它由数十万小时的语音支持。最近的文献重新关注更复杂的语言,如日语。
1 MIN READ