Alexander Pak* et Patrick Paroubek*
* LIMSI - CNRS; Bât. 508; Universite Paris XI; BP 133; 91403 ORSAY Cedex; France; alexpak@limsi.fr, pap@limsi.fr
Résumé
Le microblogage est une tendance récente dans l’Internet d’aujourd’hui. Les utilisateurs expriment leurs opinions par le biais des plates-formes de microblogage comme Twitter. Dans nos travaux, nous utilisons Twitter comme une source de données multilingues pour collecter un corpus de textes exprimant des sentiments annotés. Avec le lexique issu du corpus collecté, nous construisons un classificateur des sentiments que nous appliquons à trois types de tâches : la classification des sentiments dans des textes courts, la désambiguïsation des adjectifs de sentiments ambigus et la construction de lexiques affectifs pour d’autres langues. Nous les appelons des tâches de microanalyse des sentiments car elles opérent sur des textes courts ou des portions de textes. Les évaluations experimentales utilisant l’ensemble des données annotées à la main, la participation à la campagne d’évaluation SemEval 2010 et la corrélation avec le lexique affectif ANEW montrent que notre méthode fonctionne bien même si nous n’utilisons pas d’outils spécifiques à la langue ou de ressources construites par des humains.
Document
Rank
3