Amir Hazem* et Béatrice Daille*
*Université de Nantes, LINA UMR CNRS 6241, 2 rue de la Houssinière, BP 92208, F-44322 Nantes cedex 3; [amir.hazem,beatrice.daille]@univ-nantes.fr
Résumé
L’extraction de synonymes et des mots sémantiquement liés est une tâche utile en recherche d’information et en traitement automatique des langues. L’analyse distributionnelle a fourni un cadre théorique et opérationnel pour la détection de synonymes en corpus qui a principalement été exploité pour la découverte des synonymes de mots simples relevant de la langue générale. Dans cet article, nous nous intéressons à la découverte de synonymes de phrasèmes nominaux relevant de domaines de spécialités. Nous proposons une méthode semicompositionnelle non supervisée qui mêle analyse compositionnelle et analyse distributionnelle. Nous montrons que cette méthode permet d’identifier nombre de termes complexes synonymes non découverts par la méthode état de l’art fondée sur une analyse compositionnelle seule, tout en étant beaucoup plus précise que la méthode exploitant la seule analyse distributionnelle.
Paru dans
Document
Rank
2