Accueil du site Accueil du site Adhésion Contact Plan du site

La ressource ANNODIS, un corpus enrichi d’annotations discursives

Marie-Paule Péry-Woodley*, Stergos D. Afantenos**, Lydia-Mai Ho-Dac*, Nicholas Asher**

*CLLE-ERSS (UMR 5263 et Université de Toulouse)
Université Toulouse 2-Le Mirail
5, allées Antonio-Machado - 31058 Toulouse Cedex 9, France
pery@univ-tlse2.fr
hodac@univ-tlse2.fr

**IRIT (UMR 5505 et Université de Toulouse)
Université Paul Sabatier
118, route de Narbonne - 31062 Toulouse Cedex 9, France
Stergos.Afantenos@irit.fr
Nicholas.Asher@irit.fr


Cet article décrit la ressource ANNODIS, issue d’un projet financé par l’ANR, corpus de français écrit enrichi à différents niveaux, dont un niveau d’annotation manuelle de structures discursives. Une originalité de la ressource est de proposer un corpus diversifié (plusieurs types de textes sont représentés) et deux annotations fondées sur des approches distinctes de la structuration des discours. La description de la ressource - objets annotés, textes composant le corpus - s’accompagne de la présentation des ancrages théoriques sous-jacents aux modèles d’annotation, et des choix méthodologiques qui ont guidé les diverses phases de préparation et d’annotation du corpus. Nous formulons les enjeux d’une telle ressource pour la linguistique et le TAL, et présentons les premières exploitations.


Télécharger:
Fichier PDF
Marie-Paule Péry-Woodley, Stergos D. Afantenos, Lydia-Mai Ho-Dac, Nicholas Asher
285.6 ko

TAL Volume 52 2011 . 3. Ressources Linguistiques Libres

Date de dernière mise à jour : 6 octobre 2012, auteur : Rédacteurs en chef.