START Conference Manager    

Automatic Dialect Detection in Arabic Broadcast Media

Bilal Belainine and Fatiha Sadat


Categories

category:  Poster
Session:  6 December Session P4: African Languages Poster Session

Additional Fields

 
Abstract:   We describe our participation at the Arabic Multi-Genre Broadcast (MGB) Challenge for ASRU 2017. In this shared task, we used several supervised learning methods that emphasize only on labelled data, involving Voting Ensemble, Multi-Layer perceptron and Logistic classifiers, and their combinations, to discriminate and distinguish between four major Arabic dialects: Egyptian, Levantine, North African, Gulf and Modern Standard Arabic (MSA). Our best results were obtained during this shared task on closed submission using the Voting Ensemble with an overall accuracy of 56.10, followed by the simple logistic and Multi-Layer perceptron with an overall accuracy of 54.56 and 53.55, respectively.

 
Resume:   وصفنا مشاركتنا في تحدي البث متعدد الأنواع العربية (MGB) لـ ASRU 2017. في هذه المهمة المشتركة ، استخدمنا العديد من أساليب التعلم التي تخضع للإشراف والتي تركز فقط على البيانات المصنفة ، بما في ذلك مجموعة التصويت ، المصنفات متعددة الطبقات والمصنفات اللوجستية ، ومجموعاتها ، للتمييز والتمييز بين أربع لهجات عربية رئيسية: مصر ، بلاد الشام ، شمال إفريقيا ، الخليج والعربية الحديثة المعاصرة (MSA). تم الحصول على أفضل النتائج خلال هذه المهمة المشتركة عند التقديم المغلق باستخدام فريق التصويت مع دقة إجمالية قدرها 56.10 ، تليها الإدراك البسيط لوجستي ومتعدد الطبقات مع الشاملة دقة 54.56 و 53.55 ، على التوالي.

File(s)

[Paper (PDF)]  

START Conference Manager (V2.61.0 - Rev. 5964)