Les activités de recherche du groupe Information, Langue Ecrite et Signée (ILES) sont consacrées au traitement de données langagières écrites (à leur analyse, leur compréhension ou leur production ainsi qu'à l'acquisition des connaissances nécessaires) et signées (modélisation et traitement automatique de la langue des signes).
Quelle sémantique, quelles informations sont véhiculées par des énoncés langagiers écrits ou signés, comment les représenter, comment les détecter, comment évaluer la qualité des résultats obtenus, le tout à travers la grande variété de formes et d'origines de ces énoncés ? Ces questions constituent les thèmes de recherche du groupe.
Les travaux du groupe s'attaquent à des données complexes. Ces données sont naturelles (productions humaines : texte libre, verbatim), hétérogènes et multidimensionnelles (multiples niveaux de segmentation et de représentation, multiples modalités), de grande dimension (millions de mots différents, milliers voire millions de concepts), d'une grande variété (nombreuses dimensions de variation des énoncés et des corpus, avec des langues, des domaines, des genres, et des niveaux de langue multiples).Les méthodes employées vont de la modélisation linguistique à l'apprentis-sage automatique, avec pour la langue des signes l'étude du mouvement. Elles nécessitent de ce fait des compétences pluridisciplinaires
91405 Orsay
France