START Conference Manager    

InaNLP: Indonesian Natural Language Processing Tools API

Ayu Purwarianti, Dessi Puji Lestari and Teguh Eko Budiarto


Categories

category:  Poster
Session:  6 December Session P5: Asian Languages Poster Session

Additional Fields

 
Abstract:   We’ve developed InaNLP, an Indonesian Natural Language Processing Tools API, which consists of several NLP tools that are easily integrated into a text processing module. InaNLP consists of lexical, syntactical and text classification modules, such as POS Tagger, named entity tagger, dependency parser, constituent parser, word normalizer, quotation extraction, document level and concept level sentiment analysis, and topic classification. These modules were built using deep learning algorithms with our own annotated data. The data annotation process was conducted by Indonesian linguists. In this poster, we will show the performance score of several InaNLP modules.

 
Resume:   Kami mengembangkan InaNLP, API Kakas Pemrosesan Bahasa Alami Indonesia, yang terdiri dari beberapa kakas NLP yang mudah diintegrasikan ke dalam modul pemrosesan teks. InaNLP terdiri dari modul klasifikasi leksikal, sintaksis dan teks, seperti POS Tagger, entitas nama tagger , parser dependensi, parser konstituen, normalisasi kata, ekstraksi kutipan, analisis sentimen level dokumen, analisis sentimen level konsep, dan klasifikasi topik. Modul-modul ini dibangun menggunakan algoritma pembelajaran yang mendalam (deep learning) dengan data yang dianotasi sendiri. Proses anotasi data dilakukan oleh ahli bahasa Indonesia dan terdiri dari beberapa langkah seperti persiapan pedoman anotasi, pelabelan data dan pengecekan kualitas. Dalam poster ini, kami akan menunjukkan skor kinerja beberapa modul InaNLP.

File(s)

[Paper (PDF)]  

START Conference Manager (V2.61.0 - Rev. 5964)