Méthode et outils informatiques pour le traitement automatique des métaphores dans les documents écrits

Ferrari Stéphane

Équipe: Groupe Langage et Cognition - LIMSI-CNRS

Contenu

Mots-clés:
Résumé
Dans cette thèse, nous abordons la problématique de la métaphore du point de vue du Traitement Automatique des Langues (TAL). Les précédents travaux dans le domaine ont déjà permis l’élaboration d’outils d’analyse sémantique plus ou moins complexes. Nous constatons cependant que ces approches sont limitées dans leur application par deux facteurs importants : le problème de la détection des métaphores au sein des textes, d’une part, et le problème de la constitution de bases de connaissances relatives aux métaphores conventionnelles, d’autre part.

Nous proposons en conséquence une méthode de détection des métaphores qui présente la particularité de pouvoir être mise en oeuvre avant toute analyse sémantique. Une analyse empirique de corpus nous a permis de montrer l’existence de « marqueurs textuels » (indices lexico-syntaxiques) régulièrement utilisés pour introduire les métaphores. Nous les utilisons pour repérer les métaphores dans les documents écrits. Une extension de la méthode est proposée pour le traitement de corpus thématiques. L’ensemble a été validé sur un corpus d’une taille de 450 000 mots, composé des articles de Bourse du journal Le Monde entre 1987 et 1989. Le prototype qui implante cette méthode fait l’objet d’une évaluation dans le cadre d’un projet de recherche en cours, sous l’égide de l’AUPELF-UREF.

La détection réalisée par ce type de méthode n’est pas parfaite. Elle permet cependant d’envisager de guider des analyses plus fines qui valideront, en aval, les hypothèses faites sur la présence de métaphores. Nos travaux constituent un apport pour le traitement des métaphores. Ils annoncent clairement la possibilité d’une exploitation de méthodes d’ingénierie linguistique pour guider des traitements issus de théories plus fines.  

Informations administratives

Jury
  • Violaine PRINCE — Directeur
  • Marc EL-BEZE — Rapporteur
  • Anne NICOLLE — Rapporteur
  • Jean VERONIS — Rapporteur
  • Benoît HABERT — Examinateur
  • Joseph MARIANI — Examinateur
  • Gérard SABAH — Examinateur
Université: Université Paris 11 - Orsay
Discipline:
Date de soutenance: 17 décembre 1997
Lieu de soutenance: salle du conseil - LIMSI