Extracteur de structure de documents

Description de l'outil

Nom de l'outilExtracteur de structure de documents
Type d'outilAutre (préciser)
Mots-clésstructure de documents
URL de l'outilhttp://www.info.unicaen.fr/~giguet/tools/struct-ling.html
DescriptionLe module de recouvrement de la structure des documents permet la prise en compte de la structure de textes "bruts" ou SGML-like lors d’une analyse. Il permet de pondérer un calcul en fonction de la nature de la zone textuelle analysée.

Cet outil est assez robuste et efficace pour être aujourd’hui utilisé dans une chaîne d’indexation de documents issus de l’internet. Il est principalement utilisé pour la structuration de dépêches d’agence de presse provenant de sources multiples et multilingues, ou bien la structuration de documents plus classiques. Il a de plus la particularité d’être générique et paramétrable selon la langue, et selon la granularité des flux textuels entrants et sortants.

Informations complémentaires

Complément sur le type Extracteur de structure de documents
Disponibilité de l'outil pour la recherche et l'enseignement utilisable chez l’auteur, convention préalable
Disponibilité de l'outil pour une utilisation commerciale convention préalable
Disponibilité des sources sources non disponibles
Systèmes d'exploitation sur lesquels tourne l'outil
Type d'interface d'utilisation Interface ligne de commande
Utilisation effective dans l’équipe locale, à l’extérieur
Autres informations :
L’extracteur de la structure de documents du GREYC (http://www.info.unicaen.fr/GREYC) est intégré dans le projet de transfert de technologie LINGUIX, dans le cadre de la collaboration avec la société DATOPS (http://www.datops.com)

Auteur

Nom Groupe Syntaxe du GREYC
Affiliation GREYC - CNRS UPRESA 6072 Université de Caen Campus II F 14032 CAEN CEDEX
URL http://www.info.unicaen.fr/~giguet/

Ces renseignements ont été saisis le 1999-11-08 par ???.