Une interface pour l’exploitation de corpus arborés par des non-informaticiens : la plate-forme ScienQuest du projet Scientext

Achille Falaise*, Agnès Tutin** et Olivier Kraif**
*GETALP-LIG; BP 53, 38041 Grenoble cedex 9; achille.falaise@imag.fr
**LIDILEM; Université Stendhal;UFR SdL, BP 25, 38040 Grenoble cedex 9; agnes.tutin@u-grenoble3.fr; olivier.kraif@u-grenoble3.fr
Résumé
La communauté du TAL développe de nombreux corpus, souvent librement disponibles, disposant d’annotations riches mais difficilement utilisables pour des chercheurs non informaticiens. Si la communauté du TAL souhaite ouvrir ses corpus annotés à un public plus large, elle doit impérativement concevoir et déployer des interfaces simples, ce qui n’est pas un problème trivial. Dans cet article, nous réfléchissons, dans le cadre du projet Scientext, aux critères ergonomiques et aux méthodes permettant d’élaborer un système de requêtes facile d’accès et soulignons les limites de la plupart des outils existants. Nous présentons la plate-forme ScienQuest, conçue pour effectuer sans connaissances techniques préalables des recherches sur les parties textuelles, les parties du discours et les fonctions syntaxiques. Conformément à nos attentes, une première évaluation montre une préférence marquée pour les modes de recherche les plus simples. Au-delà du projet Scientext, l’environnement ScienQuest, conçu comme un outil générique, devrait permettre d’intégrer rapidement de nouvelles ressources textuelles libres.
Document
Rank
4