Intégration probabiliste de sens dans la représentation de textes-

Auteurs
Besançon, Romaric
Rozenknop, Antoine
Chappelier, Jean-Cédric
Rajman, Martin
Résumé
Le sujet du présent article est l’intégration des sens portés par les mots en contexte dans une représentation vectorielle de textes, au moyen d’un modèle probabiliste. La représentation vectorielle considérée est le modèle DSIR, qui étend le modèle vectoriel (VS) standard en tenant compte à la fois des occurrences et des co-occurrences de mots dans les documents. L’intégration des sens dans cette représentation se fait à l’aide d’un modèle de Champ de Markov avec variables cachées, en utilisant une information sémantique dérivée de relations de synonymie extraites d’un dictionnaire de synonymes.
Mots-clés
sémantique
sémantique distributionnelle
espace vectoriel
terme
terme d’indexation
synonymie
fréquence