Accueil du site Accueil du site Adhésion Contact Plan du site

Enrichissement d’un lexique de termes subjectifs à partir de tests sémantiques

Matthieu Vernier, Laura Monceaux

Laboratoire d’Informatique de Nantes Atlantique
LINA - UMR 6241
Université de Nantes
2, rue de la Houssinière
44322 Nantes cedex 03
Matthieu.Vernier, Laura.Monceaux@univ-nantes.fr

De récentes considérations en fouille d’opinions, guidées par des besoins applicatifs en rupture avec les approches traditionnelles du domaine, requièrent d’utiliser des ressources lexico-sémantiques quantitativement et qualitativement riches. Il n’existe actuellement pas de telles ressources pour le français. Dans cette optique, nous présentons une méthode d’apprentissage pour enrichir automatiquement un lexique de termes subjectifs. Elle s’appuie sur un oracle, l’indexation des documents du Web par un moteur de recherche, et sur les résultats donnés en réponse à un grand nombre de requêtes. La modélisation de contraintes linguistiques sur ces requêtes permet d’inférer les caractéristiques de subjectivité d’un grand nombre d’adjectifs, d’expressions nominales et verbales de la langue française. Nous évaluons l’enrichissement du lexique de termes subjectifs en mesurant en contexte la qualité de la détection locale des évaluations dans un corpus de blogs de 5 000 billets et commentaires.


Télécharger:
Fichier PDF
Matthieu Vernier, Laura Monceaux
436.6 ko


Date de dernière mise à jour : 18 mars 2012, auteur : Rédacteurs en chef.