Expression langagière ambiguë et modélisation cognitive symbolique

Surcin Sylvain

Équipe:

Courriel: surcin@lcr.thomson-csf.com

Contenu

Mots-clés: langage naturel, compréhension et interprétation de l’écrit, sémantique lexicale, ambiguïté, polysémie, emploi et usage

Résumé

Expression langagière ambiguë et modélisation cognitive symbolique. Un modèle informatique de traitement de la polysémie d’usage.

Notre but est la mise au point d’un système de traitement automatique des ambiguïtés lexicales engendrées par les formes de polysémie complexes. L’objectif majeur est la robustesse : le système doit fournir des interprétations de mots ambigus en contexte ouvert, même lorsque l’information contextuelle est dégradée.

A partir des questions "Comment décrire linguistiquement les ambiguïtés lexicales ?" et "Quels traitements informatiques des ambiguïtés ont été proposés ?", nous aboutissons au double choix suivant : nous cherchons à modéliser le traitement des formes complexes de polysémie (les moins étudiées en informatique, ou réputées non calculables) dans le cadre linguistique de la sémantique différentielle. Nous nous concentrons plus particulièrement sur la polysémie d’usage, qui n’a été qu’effleurée en linguistique et en informatique, pour en proposer une caractérisation systématique. En conclusion, l’indécidabilité de ces ambiguïtés est nécessaire à la cohérence sémantique des énoncés qui les contiennent ; elles ne doivent pas être résolues.

En nous basant sur les systèmes informatiques existants, nous proposons un modèle de lexique dynamique inspiré du modèle EDGAR. Ce modèle, PELEAS, intègre l’ambiguïté dans ses structures. Pour une occurrence ambiguë donnée, il calcule une analyse des contributions d’une base d’usages attestés dans sa signification en contexte. Ce lexique est un hybride entre un système symbolique (structures lexicales) et connexioniste (algorithme de calcul).

Il est mis en oeuvre par un jeu de logiciels sous forme de contrôles ActiveX. Leur réalisation applique des techniques de spécification formelle, de conception orientée objets avancée et de programmation distribuée. Une phase de test de ces logiciels a permis de valider le modèle qui s’avère parfaitement robuste en conservant une pertinence et une efficacité raisonnable. Les résultats montrent qu’il est particulièrement adapté à l’interprétation des mots jokers, jeux de mots et doubles sens.

Informations administratives

Jury

Université: Université Paris 8

Discipline: Informatique - Intelligence Artificielle

Date de soutenance: 21 mai 1999

Lieu de soutenance: