Cascades de transducteurs autour de la reconnaissance des entités nommées

Denis Maurel*, Nathalie Friburger*, Jean-Yves Antoine*,***, Iris Eshkol-Taravella** et Damien Nouvel**
*Université Francois Rabelais Tours; Laboratoire d’informatique; [denis.maurel, jean-yves.antoine, nathalie.friburger, damien.nouvel]@univtours.fr
**Université d’Orléans; Laboratoire ligérien de linguistique; iris.eshkol@univ-orleans.fr
***Lab-STICC CNRS
Résumé
Cet article présente tout d’abord la cascade de transducteurs CasEN pour la recone naissance des entités nommées. CasEN est implantée sous le logiciel CasSys de la plate-forme Unitex et est librement mise à disposition des utilisateurs sous licence LGPL-LR. Après une discussion sur la typologie des entités nommées qu’elle utilise et une description du fonctionenement de la cascade, nous rapportons son evaluation sur le corpus Eslo 1 (corpus d’Orléans) et les performances qu’elle a montrées au cours de la campagne d’évaluation Ester 2. Nous présentons ensuite deux autres cascades qui utilisent le texte etiqueté par CasEN. La première ajoute des informations sur les locuteurs de l’enquête sociolinguistique Eslo 1 et la seconde met en relation des entités nommées dans un corpus du journal Le Monde.
Paru dans
Document
Rank
3