Accueil du site Accueil du site Adhésion Contact Plan du site

Apprentissage non supervisé de familles morphologiques : comparaison de méthodes et aspects multilingues

Delphine Bernhard

Laboratoire d’Informatique pour la Mécanique et les Sciences de l’Ingénieur
LIMSI-CNRS
B.P. 133 F-91403
Orsay CEDEX
Delphine.Bernhard@limsi.fr

Cet article décrit MorphoClust et MorphoNet, deux méthodes pour l’apprentissage non supervisé de familles morphologiques. MorphoClust forme des familles par groupements successifs, de manière similaire aux méthodes de classification ascendante hiérarchique. La méthode MorphoNet est quant à elle fondée sur la détection de communautés dans des réseaux lexicaux. Les nœuds de ces réseaux représentent des mots et les liens des règles de transformation morphologique acquises automatiquement à partir de mots graphiquement similaires. Nous appliquons ces deux méthodes à un lexique bilingue anglais-allemand, de manière isolée et sous forme combinée, et évaluons les résultats obtenus en utilisant la base de données lexicales CELEX.


Télécharger:
Fichier PDF
Delphine Bernhard
680.2 ko

TAL Volume 51 2010 . 2. Multilinguisme et TAL

Date de dernière mise à jour : 11 avril 2011, auteur : Rédacteurs en chef.