Philippe Blache* et Stéphane Rauzy*
*Laboratoire Parole et Langage; CNRS & Aix-Marseille Universités; pb@lpl.univ-aix.fr, stephane.rauzy@lpl.univ-aix.fr
Résumé
Nous présentons le modèle de langage sous-jacent au moteur de prédiction de mots de la Plateforme de Communication Alternative (PCA), un logiciel d’aide à la communication pour personnes handicapées. Le moteur s’appuie sur un lexique général du français très couvrant qui donne pour chaque entrée la fréquence d’usage du mot et ses traits morphosyntaxiques associés. Il intègre un modèle utilisateur (lexique personnel mémorisant les mots inconnus saisis par l’utilisateur, calcul des fréquences d’usage propres, stockage des phrases produites) et un module de prédiction morphosyntaxique qui pondère les fréquences des mots prédits en fonction du contexte syntaxique de la phrase en cours de composition. L’évaluation du modèle de langage donne des résultats satisfaisants, le taux d’économie de saisies est d’environ 55 % pour une liste de 9 propositions. La contribution dominante provient de la prédiction brute basée sur les fréquences d’usage du lexique général.
Paru dans
Document
Rank
2