Accueil du site Accueil du site Adhésion Contact Plan du site

CorpusReader : construction et interrogation de corpus multiannotés

Sylvain Loiseau

LIMSI (CNRS)
B.P. 133
91403 ORSAY CEDEX
sloiseau@limsi.fr

CorpusReader est une plate-forme pour construire et interroger des corpus multiannotés. Ces corpus articulent plusieurs niveaux de description linguistique (morphologie, syntaxe, sémantique, etc.), de façon à permettre la construction d’observables associant plusieurs niveaux, ainsi que la description de corrélations entre niveaux de description. Les corpus multiannotés sont complexes à construire, à représenter et à interroger. Les spécificités de CorpusReader tiennent principalement au choix d’opérer une fusion a posteriori des annotations que produisent les outils d’analyse existants, plutôt qu’à organiser leur interopérabilité.


Télécharger:
Fichier PDF
Sylvain Loiseau
305.8 ko

TAL Volume 49 2008 . 2. Plate-formes pour le traitement automatique des langues

Date de dernière mise à jour : 17 juin 2009, auteur : Rédacteurs en chef.