Accueil du site Accueil du site Adhésion Contact Plan du site

Indexation de textes médicaux par extraction de concepts, et son utilisation

Medical texts indexation using concepts extraction, and its use

Bruno Pouliquen

Equipe : Laboratoire d'Informatique Médicale
Courriel : poulique@nomade.fr
Page : http://www.med.univ-rennes1.fr/~poulique
Cette thèse est téléchargeable à : http://www.med.univ-rennes1.fr/nomindex/

Contenu

Mots-clés : TAL, Indexation, Médecine, Système de recherche d’information, Lexique, Thésaurus, Web, Résumé automatique, Classification, Similarité de documents

Keywords : TAL, Indexation, Medicine, Search engine, Lexicon, Thesaurus, Web

Résumé
Nous nous intéressons à l’accès à l’information médicale. Nous avons utilisé un lexique de flexions, dérivations et synonymes de mots spécifiquement créé pour le domaine médical, issu de la base de connaissance "Aide au Diagnostic Médical". Nous avons exploité les mots composés et les associations de mots de ce lexique pour optimiser l’indexation d’une phrase en mots de référence. Nous avons créé un outil d’indexation permettant de reconnaître un concept d’un thésaurus médical dans une phrase en langage naturel. Nous avons ainsi pu indexer des documents médicaux par un ensemble de concepts, ensuite nous avons démontré l’utilité d’une telle indexation en développant un système de recherche d’information et divers outils : extraction de mots-clés, similarité de documents et synthèse automatique de documents. Cette indexation diminue considérablement la complexité de la représentation des connaissances contenues dans les documents en langage naturel. Les résultats des évaluations montrent que cette indexation conserve néanmoins la majeure partie de l’information sémantique.

Abstract
The work presented specifically targets the accessibility to medical information. We used a French medical lexicon (specifically created for the medical domain), and built an index tool to particularly recognize a concept from a medical thesaurus that is present in a sentence written in natural language. First we indexed medical documents with a set of concepts and then demonstrated the utility of such indexing by developing a search engine and various tools which include : keyword identification, document similarity and automatic document synthesis. This indexing greatly aided in reducing the repository complexity of natural language documents. In addition, the evaluation results demonstrate that this indexing retains the main semantic information.

Informations administratives

Jury Université : Université de Rennes I, Faculté de médecine

Discipline : Génie Biologique et Médical

Date de soutenance : 7 juin 2002

Lieu de soutenance : Faculté de médecine, Rennes


Ces renseignement ont été saisis le 06/05/2002 par Pouliquen Bruno.

Date de dernière mise à jour : 8 février 2005, auteur : .