START Conference Manager    

How a low-resource named entities recognition and transliteration framework for Vietnamese can improve the automatic machine translation ?

Tan Ngoc Le and Fatiha Sadat


Categories

category:  Poster
Session:  6 December Session P5: Asian Languages Poster Session

Additional Fields

 
Abstract:   This presentation focuses on the low-resource pair of languages, French-Vietnamese, in order to develop a powerful machine translation system while focusing on the recognition of named entities and their transliterations. In addition to statistical approaches, we used a deep learning approach within our different systems to further improve the quality and efficiency of automatic translation of named entities and to reduce the rate of words outside vocabularies, untranslated and / or incorrectly translated words, but also to improve the quality of the machine translation system.

 
Resume:   Bài trình bày này tập trung vào cặp ngôn ngữ tài nguyên thấp, tiếng Pháp-tiếng Việt, để phát triển một hệ thống dịch máy mạnh mẽ trong khi tập trung vào việc công nhận các thực thể được đặt tên và phiên âm của chúng. Ngoài các phương pháp thống kê, chúng tôi đã sử dụng phương pháp học sâu trong các hệ thống khác nhau của mình để cải thiện hơn nữa chất lượng và hiệu quả của dịch tự động các thực thể được đặt tên và để giảm tỷ lệ các từ bên ngoài từ vựng, từ chưa được dịch và / hoặc dịch sai, nhưng cũng để nâng cao chất lượng hệ thống dịch máy.

File(s)

[Paper (PDF)]  

START Conference Manager (V2.61.0 - Rev. 5964)