Une des évolutions marquantes des recherches de l’axe Tal du Lifat a été celle du développement de plus en plus marqués de traitements utiles à l’extraction d’information et la recherche d’information dans les documents numériques dont la modalité peut aussi bien être l’écrit que l’oral (parole transcrite). Dans ce cadre, les activités sont centrés autour des traitements et ressources mobilisées par le passage du MOT (langue), telle qu’il apparait dans le document, au CONCEPT, c’est-à-dire à un niveau sémantique qui permet de faire le lien avec l’ingénierie des connaissances (web sémantique). Nous nous intéressons ainsi à différents niveaux de traitements qui constituent des barrières essentielles dans la mise en œuvre d’une recherche d’information précise et robuste.
Parmi les réalisations de l'équipe se trouvent des ressources linguistiques (dictionnaire relationnel multilingue de noms propres Prolexbase, corpus Ancor annoté en coréférence...) et des réalisations logicielles (CasEN pour la reconnaissance d'entités nommées, Multiflex pour la flexion des formes polylexicales, Sybille pour la communication augmentée des personnes handicapées...). L'équipe fait partie des contributeurs à la plateforme libre Unitex.
37000 Tours
France
41000 Blois
France