Taejin Park

Taejin Park은 NVIDIA에서 NeMo Speech AI에 집중하는 시니어 리서치 사이언티스트입니다. 음성 처리용 딥러닝, 문맥 기반 화자 분리, 다중 화자 음성 인식(ASR) 등 다양한 분야의 연구를 수행하고 있습니다. 2021년 미국 서던캘리포니아대학교(USC)에서 전기컴퓨터공학 박사 및 컴퓨터공학 석사 학위를 받았으며, 당시 신호 해석 연구소(SAIL) 소속이었습니다. 그에 앞서 서울대학교에서 전기정보공학 학사 및 석사 과정을 마쳤습니다. NVIDIA에 합류하기 전에는 한국전자통신연구원(ETRI)에서 연구원으로 일했으며, Microsoft, Amazon Alexa Speech, Capio Inc. 등에서 인턴십을 수행하며 연합 지속 학습, 음성 인식, 화자 분리 기술 개발에 기여했습니다. ICASSP, ICML, Interspeech, IEEE SPL 등 주요 학회 및 저널에 다수의 논문을 발표한 바 있습니다.

Posts by Taejin Park

AI Platforms / Deployment

NVIDIA Streaming Sortformer를 사용하여 회의, 통화 및 음성 앱에서 실시간으로 발언자 식별하기

회의, 통화, 복잡한 공간, 음성 지원 앱 등 어디에서나 기술이 직면하는 핵심 질문은 “누가 언제 말했는가?”라고 할 수 있는데요. 수십 년 동안… 4 MIN READ