Accueil du site Accueil du site Adhésion Contact Plan du site

Réordonnancer des thésaurus distributionnels en combinant différents critères

Olivier Ferret

CEA, LIST, Laboratoire Vision et Ingénierie des Contenus, 91191 Gif-sur-Yvette Cedex, France
olivier.ferret@cea.fr

Dans cet article, nous proposons une méthode pour améliorer les thésaurus distributionnels grâce à un mécanisme d’amorçage : un ensemble d’exemples positifs et négatifs de mots sémantiquement similaires sont sélectionnés de façon non supervisée et utilisés pour entraîner un classifieur supervisé. Celui-ci est ensuite appliqué pour réordonner les voisins sémantiques du thésaurus utilisé pour la sélection des exemples. Nous montrons comment les relations entre les constituants de noms composés similaires peuvent être utilisées pour réaliser une telle sélection et comment conjuguer ce critère, soit de façon précoce, soit de façon tardive, à un critère déjà expérimenté touchant à la symétrie des relations sémantiques. Nous évaluons l’intérêt de ces propositions sur un large ensemble de noms en anglais couvrant un vaste spectre de fréquences. Cet article est une version étendue de (Ferret, 2013 ; Ferret, 2015a).


Télécharger:
Fichier PDF
Olivier Ferret
384.2 ko

TAL Volume 56 2015 . 2. Sémantique distributionnelle

Date de dernière mise à jour : 12 février 2016, auteur : root.