Accueil du site Accueil du site Adhésion Contact Plan du site

Fouille d’erreurs sur des sorties d’analyseurs syntaxiques

Benoît Sagot, Éric de La Clergerie

INRIA Paris-Rocquencourt - Projet ALPAGE
Domaine de Voluceau
Rocquencourt, B.P. 105
F-78153 Le Chesnay cedex
benoit.sagot,eric.de_la_clergerie@inria.fr

Nous présentons une méthode de fouille d’erreurs pour détecter automatiquement des erreurs dans les ressources utilisées par les systèmes d’analyse syntaxique. Nous avons mis en œuvre cette méthode sur le résultat de l’analyse de plusieurs millions de mots par deux systèmes d’analyse différents qui ont toutefois en commun le lexique syntaxique et la chaîne de traitement présyntaxique. Nous pouvons ainsi identifier des inexactitudes et des incomplétudes dans les ressources utilisées. En particulier, la comparaison des résultats obtenus sur les sorties des deux analyseurs sur un même corpus nous permet d’isoler les problèmes issus des ressources partagées de ceux issus des grammaires.


Télécharger:
Fichier PDF
Benoît Sagot, Éric de La Clergerie
268 ko


Date de dernière mise à jour : 6 janvier 2009, auteur : Rédacteurs en chef.