START Conference Manager    

MultiTAL : an online platform to list NLP tools for under-resourced languages

Damien Nouvel, Driss Sadoun and Mathieu Valette


Categories

category:  Poster
Session:  5 December Session P2: European and Arctic Languages Poster Session

Additional Fields

 
Abstract:   Diversity and variety of human languages raises indisputable difficulties for processing textual data. Regarding under-resourced languages, many softwares have been implemented, but many are poorly referenced and documented. The ERTIM (INALCO) lab has published in 2016 a website (http://multital.inalco.fr) that addresses this issue. Our website lists tools available for languages. For each software, the database provides information concerning : NLP tasks, implemented method, OS compatibility, among others. We do not pretend to be exhaustive, but people populating the database are speakers of concerned languages, they downloaded and tested softwares, and provided technical information for their installation and use.

 
Resume:   La diversité et la variété des langues humaines donne d'incontestables difficultés pour le traitement de données textuelles. Concernant les langages peu dotés, de nombreux logiciels ont été implémentés, mais beaucoup restent peu référencés et mal documentés. L'équipe ERTIM a mis en ligne en 2016 un site (http://multital.inalco.fr) qui réalise ce travail. En faisant la liste des outils par langage, cette base de données apporte des informations sur leur utilisation. Nous ne prétendons pas être exhaustifs, mais les personnes remplissant la base étaient locuteurs des langues concernées, elles ont téléchargé et testé les outils, et ont renseignés des informations sur leur installation et leur utilisation.

File(s)

[Paper (PDF)]  

START Conference Manager (V2.61.0 - Rev. 5964)