START Conference Manager    

Automatic Recognition of mixed Ukrainian-Russian Speech

Valeriy Pylypenko and Tetyana Lyudovyk


category:  Poster
Session:  5 December Session P2: European and Arctic Languages Poster Session

Additional Fields

Abstract:   This work presents an approach to recognition of conversational speech with code-switching which is widespread in Ukraine now. Both inter-sentential and intra-sentential Ukrainian/Russian code-switching is handled. The approach takes into account closely related Russian and Ukrainian phonetic systems. A cross-lingual ASR system is developed. The acoustic model and pronunciation lexicon are based on Ukrainian phone set. Experiments with different types of code-switching speech (Parliamentary, TV broadcast) were conducted and results are presented. The approach is suitable especially in cases of intra-sentential code-switching where language identification is problematic.

Resume:   Ця робота представляє підхід до розпізнавання усного мовлення з переключенням між українською та російською мовами, яке зараз поширене в Україні. Обробляється як міжфразове перемикання, так і всередині фраз. Підхід враховує особливості фонетичних систем тісно пов'язаних російської та української мов. Розроблена багатомовна система автоматичного розпізнавання мовлення. Акустична модель та лексика вимови базуються на українській множині фонем. Представлені результати розпізнавання мовлення з переключенням мови з декількох джерел (Парламентська, ТВ трансляція). Підхід особливо корисний у випадках перемикання мови всередині фраз, де ідентифікація мови є проблематичною.


[Paper (PDF)]  

START Conference Manager (V2.61.0 - Rev. 5964)