Analyse syntaxique de langues faiblement dotées à partir de plongements de mots multilingues

KyungTae Lim*, Niko Partanen*,  Thierry Poibeau*

*Laboratoire LATTICE, CNRS et École normale supérieure, PSL et Université Sorbonne nouvelle, USPC 1 rue Maurice Arnoux, 92120 Montrouge – France

Cet article présente une tentative pour appliquer des méthodes d’analyse syntaxique performantes, à base de réseaux de neurones récursifs, à des langues pour lesquelles on dis- pose de très peu de ressources. Nous proposons une méthode originale à base de plongements de mots multilingues obtenus à partir de langues plus ou moins proches typologiquement, afin de déterminer la meilleure combinaison de langues possibles pour l’apprentissage. L’approche a permis d’obtenir des résultats encourageants dans des contextes considérés comme linguisti- quement difficiles. Le code source est disponible en ligne (voir https://github.com/jujbob). 

Document: