Accueil du site Accueil du site Adhésion Contact Plan du site

Étude et intégration de contraintes contextuelles dans la compréhension automatique du français

A study and implementation of contextual constraints in the understanding of French

Pascal Mouret

Equipe : Laboratoire d'Informatique de Marseille
Courriel : mouret@up.univ-mrs.fr

Contenu

Mots-clés : référence, anaphores, contexte linguistique, aide à la composition, représentation du sens, représentation du contexte, pluriel

Keywords : reference, anaphorae, linguistic context, guided composition, representation of meaning, contextual representation, plural

Résumé
Ce mémoire de thèse est consacré à l’étude de problèmes liés à la référence. Dans la lignée des travaux sur les anaphores et la représentation du discours de H. Kamp et de J. Groenendijk et M. Stokhof, nous nous intéressons à modéliser les groupes nominaux référentiels et leurs rapports au contexte linguistique et à réaliser une application à partir de ces résultats.

Le cadre théorique, algorithmique et applicatif dans lequel s’inscrit cette étude s’articule autour de deux points principaux :

-   distinction de différents niveaux de bonne formation et de représentation d’une phrase (niveaux lexical, syntaxique, sémantique, conceptuel et contextuel) ;

-   analyse, synthèse et aide à la composition de phrases par coroutinage de contraintes sur ces différents niveaux.

Elle se décompose en trois parties :

1. J’argumente une définition du niveau contextuel en termes d’individus et de propriétés, articulée autour des notions de contexte linguistique, référence et interprétation.

Puis, je m’attache à étudier la nature du rapport qu’entretiennent les différents groupes nominaux référentiels avec le contexte ainsi que les règles permettant d’identifier les entités auxquelles ils réfèrent. J’introduis notamment la distinction entre entités réelles et potentielles, pour traiter certains problèmes entre référence et quantification universelle.

Enfin, je présente les points essentiels des formalismes de représentation du sens et de représentation du contexte.

2. Je présente une application effective de ces résultats dans le cadre du projet ILLICO, et je décris des algorithmes originaux pour tenir compte des problèmes de résolution au plus tôt liés à l’approche d’aide à la composition. En particulier, je montre que le critère classique d’unicité du référent n’est plus suffisant pour la résolution des groupes nominaux définis.

3. Je présente certains problèmes connexes, et notamment une approche originale de la représentation du pluriel.

Abstract
This thesis focuses on the study of problems linked to the notion of reference. Following the works on anaphors and discourse representation by Hans Kamp or Jeroen Groenendijk and Martin Stokhof, we tackle the modelisation of referential noun phrases and of their dependencies on the linguistic context. The theoretic, algorithmic and applicational framework of this study relies on two main features :

-   a distinction between different levels of well-formedness and representation of sentences (lexical, syntactic, semantic, conceptual and contextual levels) ;

-   analysis, synthesis and guided composition of sentences by coroutining constraints on those different levels.

This study is divided in three parts :

1. I argue a definition of the contextual level in terms of individuals and properties, and based upon the notions of linguistic context, reference and interpretation. I then proceed with the study of the links that obey between the different referential noun phrases and the context as well as the rules that enable us to point out the entities they are referring to. In particular, I introduce a distinction between "real" entities and potential entities, in order to solve some problems stemming from reference and universal quantification. Finally, I present the essential features of a formalism of representation of the meaning and of a formalism of representation of the context.

2. I show an actual implementation of these results in the ILLICO project, and I describe original algorithms that deal with problems of early resolution stemming from the guided composition approach. In particular, I show that the usual criterion of unicity of the referent is not enough for the resolution of definite noun phrases in this respect.

3. I tackle some related problems, mainly an original approach to the representation of the plural.

Informations administratives

Jury Université : Université de la Méditerranée (Aix-Marseille II)

Discipline : Informatique

Date de soutenance : 20 juillet 2000

Lieu de soutenance : Faculté des Sciences de Luminy


Ces renseignement ont été saisis le 15/01/2001 par Pascal Mouret.

Date de dernière mise à jour : 8 février 2005, auteur : .