Cartel (Corpus, Applications et Ressources pour le Traitement et l'Etude du Langage) est un axe de recherche du laboratoire Cognition, Langues, Langage, Ergonomie (CLLE), Equipe de Recherche en Syntaxe et Sémantique (ERSS), UMR 5263.
Les recherches de CARTEL portent sur le développement, l'adaptation et l'utilisation de ressources informatiques pour l'étude du langage. L'approche développée dans cet axe est essentiellement linguistique. Elle se fonde sur l'idée que l'observation de données massives fait émerger des questionnements linguistiques originaux et que l'exploitation de ressources riches et variées peut contribuer à leur traitement. Les travaux de l'axe visent à la fois :
- la construction de ressources langagières (corpus et lexiques) ;
- le développement d'outils d'ingénierie linguistique ;
- l'analyse linguistique outillée ;
- la modélisation du lexique.
Nos recherches abordent des domaines variés : la structuration du lexique sur les plans sémantiques et morphologiques, les aspects linguistiques de la recherche d'information, l'analyse syntaxique et discursive, la classification de documents, etc. Les productions (outils et données) sont rendues accessibles à la communauté, aussi librement que le permettent les contraintes de propriété, sur le serveur dédié REDAC (REssources Développées À CLLE-ERSS) : redac.univ-tlse2.fr
Les trois principales thématiques de l'axe CARTEL sont :
- Sémantique distributionnelle
- Structuration du lexique
- Caractérisation et classification linguistique de corpus
Spécificités des travaux de l'axe
Au sein d'un environnement scientifique qui oriente le TAL vers un usage intensif de méthodes statistiques sur des données massives, nous privilégions le traitement linguistique. Notre approche donne une place centrale à l'observation fine des données manipulées avant et pendant un traitement automatisé, et au questionnement linguistique, même lorsque nous répondons à des besoins applicatifs. Ceci ne nous empêche pas de faire usage des méthodes par apprentissage (classification, fouille de données), en les articulant le plus souvent avec des modes d'observation outillés allant de la structure globale (visualisation, statistiques) aux phénomènes locaux (en facilitant le retour aux données initiales).
31000 Toulouse
France