Analyse morphologique non supervisée en domaine biomédical. Application à la recherche d’information

Vincent Claveau* et Ewa Kijak**
**Univ. Rennes 1;Campus de Beaulieu;35042 Rennes;France; ewa.kijak@irisa.fr
Résumé
Dans le domaine biomédical, utiliser des termes spécialisés est essentiel pour accéder à l’information. Cependant, dans beaucoup de langues, ces termes sont des constructions morphologiques complexes qui compliquent cet accès à l’information. Dans cet article, nous nous intéressons à l’identification des composants morphologiques de ces termes et à leur utilisation pour une tâche de recherche d’information (RI). Nous proposons différentes approches reposant sur un alignement automatique avec une langue pivot particulière, le japonais, et sur un apprentissage par analogie permettant de produire des analyses morphologiques fines des termes d’une langue donnée. Ces analyses morphologiques sont ensuite utilisées pour améliorer l’indexation de documents biomédicaux. Les expériences rapportées montrent la validité de cette approche avec des gains en MAP de plus de 10 % par rapport à un système de RI standard.
Paru dans
Document
Rank
1