CARTEL (CLLE-ERSS)

Soumis par Ludovic.Tanguy… le mar 19/03/2019 - 09:09

Cartel (Corpus, Applications et Ressources pour le Traitement et l'Etude du Langage) est un axe de recherche du laboratoire Cognition, Langues, Langage, Ergonomie (CLLE), Equipe de Recherche en Syntaxe et Sémantique (ERSS), UMR 5263.

Les recherches de CARTEL portent sur le développement, l'adaptation et l'utilisation de ressources informatiques pour l'étude du langage. L'approche développée dans cet axe est essentiellement linguistique. Elle se fonde sur l'idée que l'observation de données massives fait émerger des questionnements linguistiques originaux et que l'exploitation de ressources riches et variées peut contribuer à leur traitement. Les travaux de l'axe visent à la fois :

  • la construction de ressources langagières (corpus et lexiques) ;
  • le développement d'outils d'ingénierie linguistique ;
  • l'analyse linguistique outillée ;
  • la modélisation du lexique.

Nos recherches abordent des domaines variés : la structuration du lexique sur les plans sémantiques et morphologiques, les aspects linguistiques de la recherche d'information, l'analyse syntaxique et discursive, la classification de documents, etc. Les productions (outils et données) sont rendues accessibles à la communauté, aussi librement que le permettent les contraintes de propriété, sur le serveur dédié REDAC (REssources Développées À CLLE-ERSS) : redac.univ-tlse2.fr

Les trois principales thématiques de l'axe CARTEL sont :

 

Spécificités des travaux de l'axe

Au sein d'un environnement scientifique qui oriente le TAL vers un usage intensif de méthodes statistiques sur des données massives, nous privilégions le traitement linguistique. Notre approche donne une place centrale à l'observation fine des données manipulées avant et pendant un traitement automatisé, et au questionnement linguistique, même lorsque nous répondons à des besoins applicatifs. Ceci ne nous empêche pas de faire usage des méthodes par apprentissage (classification, fouille de données), en les articulant le plus souvent avec des modes d'observation outillés allant de la structure globale (visualisation, statistiques) aux phénomènes locaux (en facilitant le retour aux données initiales).

 

Thématiques principales
linguistique outillée, corpus
lexique
sémantique distributionnelle
morphologie
classification de documents
Lieu

31000 Toulouse
France

Tutelle(s)
CNRS
Université de Toulouse 2 Jean Jaurès
Université de Bordeaux Montagine
Responsable de l'équipe
Ludovic Tanguy
Taille
16
Nombre de permanents
7