Accueil du site Accueil du site Adhésion Contact Plan du site

Xerox POS tagger

Description de l'outil

Nom de l'outil Xerox POS tagger
Type d'outil Étiquetage
Mots clés Etiqueteur morphosyntaxique.
URL de l'outil http://www.xrce.xerox.com/research/mltt/fsnlp/tagger.html
URL de démo http://www.xrce.xerox.com/research/mltt/toolhome.html
Description Etiqueteur morphosyntaxique (segmentation, analyse lexicale et desambiguisation) pour plusieurs langues.

Le processus d’étiquetage comporte trois étapes :

1.La segmentation décompose un texte en unités lexicales ;

2.L’analyse lexicale fournit la liste des étiquettes attachées à chaque unité lexicale ;

3.La désambiguïsation attribue à chaque unité lexicale une étiquette unique en contexte.

Chaque étape est définie par une application qui utilise des données spécifiques à chaque langue :

La segmentation utilise un transducteur pour insérer des frontières de mots entre unités lexicales simples, lexies complexes, signes de ponctuation, etc.

L’analyse lexicale recourt à un analyseur morphologique pour associer chaque unité lexicale à une ou plusieurs étiquettes. Les mots inconnus sont traités par un "devineur" qui détermine les étiquettes possibles principalement à partir d’une analyse des affixes.

Des étiqueteurs de parties du discours ont été développés pour de nombreuses langues, dont l’allemand, l’anglais, l’espagnol, le français, le néerlandais, l’italien, le portugais.

Informations complémentaires

Utilisation effective dans l’équipe locale, dans l’entreprise ou l’institution, dans l’équipe élargie (même site), à l’extérieur
Disponibilité de l'outil pour la recherche et l'enseignement convention préalable, vendu (préciser le prix ci-dessous)
Disponibilité de l'outil pour une utilisation commerciale convention préalable, vendu (préciser le prix ci-dessous)
Disponibilité des sources sources non disponibles
Systèmes d'exploitation sur lesquels tourne l'outil Unix
Type d'interface d'utilisation Interface ligne de commande
Ressources linguistiques associées disponibles Lexique morphologique, tableaux HMM.

Auteur

Nom XEROX (divers auteurs)
URL http://www.xrce.xerox.com/
Affiliation Xerox Research Centre Europe

Contact

Nom Anne Schiller
URL http://www.xrce.xerox.com/
Affiliation Xerox Research Centre Europe


Ces renseignement ont été saisis le 04/11/1999 par Nuria Gala Pavia.

Date de dernière mise à jour : 8 février 2005, auteur : .