Accueil du site Accueil du site Adhésion Contact Plan du site

Évaluation sur mesure de modèles distributionnels sur un corpus spécialisé : comparaison des approches par contextes syntaxiques et par fenêtres graphiques

Ludovic Tanguy, Franck Sajous, Nabil Hathout

CLLE-ERSS (CNRS & Université de Toulouse 2), 5 allées Antonio Machado, F-31058 Toulouse Cedex 9
[ludovic.tanguy, franck.sajous, nabil.hathout]@univ-tlse2.fr

Il est possible de construire des modèles distributionnels en ne considérant que la cooccurrence graphique entre les mots, ou bien en utilisant des relations syntaxiques de complexité variable. Si des comparaisons systématiques n’ont jamais pu trancher définitivement en faveur de l’une ou de l’autre, elles ont rarement été menées sur un corpus de taille réduite ou en langue de spécialité. Nous proposons ici une palette d’expériences visant l’observation d’un ensemble de modèles distributionnels construits à partir d’un petit corpus d’articles en français dans le domaine du TAL. Un jeu de données a été spécifiquement conçu pour l’évaluation des différentes configurations. Ces expériences montrent que les modèles qui prennent en compte de façon raisonnable les informations syntaxiques obtiennent globalement de meilleurs résultats.


Télécharger:
Tanguy PDF
Ludovic Tanguy, Franck Sajous, Nabil Hathout
369.9 ko

TAL Volume 56 2015 . 2. Sémantique distributionnelle

Date de dernière mise à jour : 12 février 2016, auteur : root.