START Conference Manager    

Developing technologies for low-resource Uralic languages: Case studies on Saami and Komi varieties

Niko Partanen, Michael Rießler and Thierry Poibeau


Categories

category:  Poster
Session:  5 December Session P2: European and Arctic Languages Poster Session

Additional Fields

 
Abstract:   The Uralic languages are spoken in northern Eurasia, and almost all of them are endangered. Language technology can play a major role in documenting and describing these languages better, and in making related workflows faster and more efficient. However, applying modern methods effectively in this context remains a challenge.

We have developed language technology for Komi and Saami, with a focus on a low-resource scenario. Besides providing an overview of this work, we detail what we see as the main challenges. Although we focus on individual languages, our experiences also translate to the wider situation of endangered languages outside Eurasia.

 
Resume:   Uralilaisia kieliä puhutaan laajalla alueella Pohjois-Euraasiassa, ja valtaosa niistä on uhanalaisia. Kieliteknologialla voi olla merkittävä rooli näiden kielten kuvaamisessa ja dokumentaatiossa, erityisesti tehden näihin toimiin liittyvistä käytännöistä tehokkaampia ja nopeampia. Kieliteknologian nykysovellusten hyödyntämisessä tässä kontekstissa on silti runsaita ratkaisemattomia haasteita.

Työryhmämme on kehittänyt kieliteknologiaa saamelaiskielille ja komille, erityisesti tilanteeseen, jossa käytettäviä resursseja on vähän. Kuvaamme aiemmin tehdyn työn sekä keskeisimmät ongelmakohdat. Vaikka keskitymme yksittäisiin kieliin, ovat kokemuksemme sovellettavissa myös muihin uhanalaisiin vähemmistökieliin oman alueemme ulkopuolella.

File(s)

[Paper (PDF)]  

START Conference Manager (V2.61.0 - Rev. 5964)