START Conference Manager    

Project Mélange: Speech and Language Technologies for Code-switching

Sunayana Sitaram, Monojit Choudhury and Kalika Bali


Categories

category:  Poster
Session:  6 December Session P5: Asian Languages Poster Session

Additional Fields

 
Abstract:   Code-switching is the use of two or more languages in the same utterance or conversation, and is common in multilingual communities across the world. Project Mélange aims to process, understand and generate code-switched speech and text, so that technologies that interact with multilinguals can be natural and effective. In this poster, we present an overview of our research in the following areas 1. Data collection and generation 2. Core NLP and speech technologies (Language ID, Part of Speech tagging, Language Modeling, Speech Recognition and Synthesis) 3. sociolinguistics and pragmatics using Twitter data 4. user studies on dialogue and discourse

 
Resume:   एक ही वार्तालाप में दो या दो से अधिक भाषाओं के उपयोग को कोड-स्विचिंग कहा जाता है, जो कि दुनिया भर के बहुभाषी समुदायों में आम है। प्रोजेक्ट मिलांज का उद्देश्य कोड-स्विच किए गए भाषण और पाठ को संसाधित करना, समझना और रचना करना है, ताकि बहुभाषियों के साथ बातचीत करने वाली प्रौद्योगिकियां प्राकृतिक और प्रभावी हो सकें। इस पोस्टर में हम निम्नलिखित क्षेत्रों में अपने शोध का एक अवलोकन प्रस्तुत करते हैं: 1. डेटा संग्रह और संश्लेषण 2. मौलिक भाषण प्रौद्योगिकियां (भाषा निर्धारण, शब्द के भेद निर्णय, भाषा मॉडलिंग, भाषण प्रतिलेखन और संश्लेषण) 3. सामाजिक और व्यावहारिक भाषाविज्ञान 4. संवाद और संभाषण पर उपयोगकर्ता अध्ययन।

File(s)

[Paper (PDF)]  

START Conference Manager (V2.61.0 - Rev. 5964)