Accueil du site Accueil du site Adhésion Contact Plan du site

Extracteur de structure de documents

Description de l'outil

Nom de l'outil Extracteur de structure de documents
Type d'outil Autre (préciser)
Complément sur le type Extracteur de structure de documents
Mots clés structure de documents
URL de l'outil http://www.info.unicaen.fr/~giguet/tools/struct-ling.html
Description Le module de recouvrement de la structure des documents permet la prise en compte de la structure de textes "bruts" ou SGML-like lors d’une analyse. Il permet de pondérer un calcul en fonction de la nature de la zone textuelle analysée.

Cet outil est assez robuste et efficace pour être aujourd’hui utilisé dans une chaîne d’indexation de documents issus de l’internet. Il est principalement utilisé pour la structuration de dépêches d’agence de presse provenant de sources multiples et multilingues, ou bien la structuration de documents plus classiques. Il a de plus la particularité d’être générique et paramétrable selon la langue, et selon la granularité des flux textuels entrants et sortants.

Informations complémentaires

Utilisation effective dans l’équipe locale, à l’extérieur
Disponibilité de l'outil pour la recherche et l'enseignement utilisable chez l’auteur, convention préalable
Disponibilité de l'outil pour une utilisation commerciale convention préalable
Disponibilité des sources sources non disponibles
Systèmes d'exploitation sur lesquels tourne l'outil
Type d'interface d'utilisation Interface ligne de commande

Auteur

Nom Groupe Syntaxe du GREYC
Affiliation GREYC - CNRS UPRESA 6072 Université de Caen Campus II F 14032 CAEN CEDEX

Contact

Nom Emmanuel Giguet
URL http://www.info.unicaen.fr/~giguet/
Affiliation GREYC - CNRS UPRESA 6072 Université de Caen Campus II F 14032 CAEN CEDEX

Autres informations :
L’extracteur de la structure de documents du GREYC est intégré dans le projet de transfert de technologie LINGUIX, dans le cadre de la collaboration avec la société DATOPS


Ces renseignement ont été saisis le 08/11/1999 par ???.

Date de dernière mise à jour : 8 février 2005, auteur : .