Accueil du site Accueil du site Adhésion Contact Plan du site

Antelope : une plate-forme industrielle de traitement linguistique

François-Régis Chaumartin

Société PROXEM (« Procédures Sémantiques »)
7, impasse Dumur
92110 Clichy
frc@proxem.com

Équipe ALPAGE (INRIA & Université Paris 7)
30, rue du Château-des-Rentiers
75013 Paris
fchaumartin@linguist.jussieu.fr


La plate-forme de traitement linguistique Antelope, en partie basée sur la Théorie Sens-Texte (TST), permet l’analyse syntaxique et sémantique de textes sur des corpus de volume important. Antelope intègre plusieurs composants préexistants (pour l’analyse syntaxique) ainsi que des données linguistiques à large couverture provenant de différentes sources. Un effort d’intégration permet néanmoins d’offrir une plate-forme homogène. Notre contribution directe concerne l’ajout de composants d’analyse sémantique et la formalisation d’un modèle linguistique unifié. Cet article présente la plate-forme et la compare à d’autres projets de référence. Il propose un retour d’expérience d’un éditeur de logiciel vers la communauté du TAL, en soulignant les précautions architecturales à prendre pour qu’un tel ensemble complexe reste maintenable.


Télécharger:
Fichier PDF
François-Régis Chaumartin
441.3 ko

TAL Volume 49 2008 . 2. Plate-formes pour le traitement automatique des langues

Date de dernière mise à jour : 17 juin 2009, auteur : Rédacteurs en chef.