Posts by Taejin Park
AI 平台/部署
2025年 8月 18日
使用 NVIDIA Streaming Sortformer 实时识别会议、通话和语音应用中的演讲者
在每一次会议、电话交流、 多人场合或支持语音的应用中,技术始终面临一个核心难题:谁在何时发言?几十年来,若不依赖专用设备或离线批量处理,
2 MIN READ
对话式人工智能
2022年 9月 16日
通过多尺度说话人分解实现动态尺度加权
说话人日记化是按说话人标签对录音进行分段的过程,旨在回答“谁在何时发言?”。与语音识别相比,它有着明显的区别。 在你执行说话人日记化之前,
2 MIN READ