START Conference Manager    

Current Status, Issues, and Future Directions for Ethiopian Natural Language Processing (NLP) Research

Seid Yimam and Chris Biemann


Categories

category:  Poster
Session:  6 December Session P4: African Languages Poster Session

Additional Fields

 
Abstract:   These days, the generation of resources (mainly text and speech) for many languages is dramatically increasing. However, high-resource languages such as English and low-resource languages such as Amharic, greatly differ on the amount of NLP components, tools and applications. In this poster, we will briefly discuss the state-of-the-art NLP research for Ethiopian languages. Then, the main bottlenecks that hinder the development of the required resources will be reviewed. Finally, we will point out best practices to solve current issues and indicate appropriate tools and models that can be easily adapted for low-resource NLP research, particularly for Ethiopian languages.

 
Resume:   በአሁኑ ግዜ፣ ለብዙ ቋንቋዎች መረጃዎችን (በዋነኛነት የጽሑፍ እና የንግግር) ማግኘት እጅግ በጣም ቀላል እየሆነ እየሆነ መጥቷለ። ሆኖም ግን እንደ እንግሊዝኛ በብዛት መተግበሪያ ያላቸውና እንደ አማርኛ ያሉ እጅግ በጣም ዝቅተኛ መተግበሪያ ያላቸው ቋንቋዎች፣ በተፈጥሯዊ የቋንቋ ቴክኖሎጂ (ተ.ቋ.ቴ - NLP)ግብዓቶች፤ መሳሪያዎች እና መተግበሪያዎች መጠን ሰፊ ልዩነት አላቸው። በዚህ ፖስተር ጽሁፍ፤ በመጀመሪያ የኢትዮያ ቋንቋዎች በተ.ቋ.ቴ ምርምር አሁን ያሉበት ደረጃ በጥልቀት ይብራራሉ። በመቀጠል ለኢዮጵያ ተ.ቋ.ቴ ምርምር እደገት እንቅፋት የሆኑ ዋና ዋና ክፍተቶች ይገመገማሉ፡፡ በመጨረሻም ፣ ወቅታዊ እና ተያያዥ ተግዳሮቶችን እንደት መፍታት እንደሚቻል፤ አሁን ላይ የሚገኙ የሌሎች የበለፀጉ የቋንቋ መተግበሪያዎችን እና ሞደሎችን የመተግበሪያ እጥረት ላለባቸው ቋንቋቆች(በተለይም ለኢትዮጵያን ቋንቋዎች) እንደት ማላመድና መጠቀም እንደሚቻል ይጠቆማል፡፡

File(s)

[Paper (PDF)]  

START Conference Manager (V2.61.0 - Rev. 5964)