Matthieu Vernier*,** et Laura Monceaux*,**
*Laboratoire d’Informatique de Nantes Atlantique; LINA - UMR 6241
**Université de Nantes; 2, rue de la Houssinière; 44322 Nantes cedex 03; Matthieu.Vernier, Laura.Monceaux@univ-nantes.fr
Résumé
De récentes considérations en fouille d’opinions, guidées par des besoins applicatifs en rupture avec les approches traditionnelles du domaine, requièrent d’utiliser des ressources lexico-sémantiques quantitativement et qualitativement riches. Il n’existe actuellement pas de telles ressources pour le français. Dans cette optique, nous présentons une méthode d’apprentissage pour enrichir automatiquement un lexique de termes subjectifs. Elle s’appuie sur un oracle, l’indexation des documents du Web par un moteur de recherche, et sur les résultats donnés en réponse à un grand nombre de requêtes. La modélisation de contraintes linguistiques sur ces requêtes permet d’inférer les caractéristiques de subjectivité d’un grand nombre d’adjectifs, d’expressions nominales et verbales de la langue française. Nous évaluons l’enrichissement du lexique de termes subjectifs en mesurant en contexte la qualité de la détection locale des évaluations dans un corpus de blogs de 5 000 billets et commentaires.
Paru dans
Document
Rank
5