Aleksandr Laptev

Aleksandr Laptev 是 ITMO 大学的博士生,也是 NVIDIA 的高级研究科学家。他的科学兴趣是自动语音识别、语音合成( TTS )和自然语言处理。他撰写开放获取科学文章,为开放源代码软件做出贡献,并参加国际语音识别比赛。他目前的研究领域是可微加权有限状态传感器。

Posts by Aleksandr Laptev

对话式人工智能/自然语言处理

基于熵的字级 ASR 置信度估计方法

一旦您有了自动语音识别( ASR )模型预测,您可能还想知道这些预测正确的可能性。这种正确率或置信度通常作为原始预测概率(快速、 4 MIN READ
对话式人工智能/自然语言处理

更改 CTC 规则以减少训练和解码中的内存消耗

训练自动语音识别( ASR )模型的损失函数并不是一成不变的。旧的损失函数规则不一定是最优的。 3 MIN READ