Accueil du site Accueil du site Adhésion Contact Plan du site

Extraction et capitalisation automatiques de connaissances à partir de documents textuels. SEEK-JAVA : identification et interprétation de relations entre concepts.

Knowledge extraction and capitalization automatic from textual documents. SEEK-JAVA : relations identification and interpretation between concepts.

Florence Le Priol

Equipe : CAMS-LaLIC
Courriel : flepriol@paris4.sorbonne.fr
Page : http://www.lalic.paris4.sorbonne.fr/~lepriol
Cette thèse est téléchargeable à : http://www.lalic.paris4.sorbonne.fr/~lepriol

Contenu

Mots-clés : Informatique, extraction d information, acquisition de connaissances, terminologie, exploration contextuelle, relations sémantiques, graphes, base de données.

Keywords : Data processing, information extraction, knowledge acquisition, terminology, contextual exploration, semantic relation, graph, data base.

Résumé
Le travail présenté dans cette thèse se situe à la frontière de plusieurs domaines : informatique, extraction d information, acquisition de connaissances, terminologie et linguistique. A partir de conceptualisations sémantiques élaborées dans le cadre d un modèle général de traitement des langues en rapport avec la cognition, le modèle de la Grammaire Applicative et Cognitive (GAC), un premier système automatique a été réalisé en 1993 (Jouis 93) : SEEK. La présente étude a repris certaines des analyses déjà présentées dans SEEK mais notre effort a porté d une part, sur une réanalyse et une réorganisation des connaissances linguistiques et d autre part, sur une nouvelle modélisation faisant usage des potentialités offertes par le langage JAVA de façon à intégrer le modèle de la GAC dans une plate-forme appelée FilText et sa réalisation informatique ContextO. Le système SEEK-JAVA identifie et interprète des relations entre concepts à partir du traitement automatique de textes et fournit les résultats à la fois sous forme de graphes et d une base de données.

Abstract
Work presented in this thesis is situated in the field of several domain : data processing, information extraction, knowledge acquisition, terminology, linguistics. From semantic conceptualizations elaborated within the framework of a general model of processing of languages in touch with the cognition, the Grammar Applicative and Cognitive ( GAC) model, a first automatic system was realized in 1993 (Jouis 93) : SEEK. The present study resumed some of the analyses already presented in SEEK but our effort concerned on one hand, a new analyze and a reorganization of linguistic knowledge and on the other hand, a new modeling making use of potentialities offered by JAVA language so as to integrate this model into a platform called FilText and its computer realization ContextO. SEEK-JAVA system identifies and interprets relations between concepts from text automatic treatment and supplies results on one hand in graph on the other hand in a data base.

Informations administratives

Jury Université : Université Paris-Sorbonne

Discipline : Informatique Linguistique

Date de soutenance : 12 décembre 2000

Lieu de soutenance : ISHA, Paris


Ces renseignement ont été saisis le 12/01/2001 par Florence Le Priol.

Date de dernière mise à jour : 8 février 2005, auteur : .