Accueil du site Accueil du site Adhésion Contact Plan du site

Discours et document : traitements automatiques

2006 Volume 47 Numéro 2.

Direction : Marie-Paule Péry-Woodley et Donia Scott.

Discours et document : traitements automatiques Computational Approaches to Discourse and Document Processing

NUMÉRO SPÉCIAL DE LA REVUE TAL

Date limite de soumission : 22 septembre 2006

[English version of CFP below]

REDACTEURS INVITES : Marie-Paule Péry-Woodley (ERSS - Université de Toulouse 2, France) and Donia Scott (Open University, UK)

PREMIER APPEL

Ce numéro spécial de TAL est consacré à ce que nous percevons comme une convergence croissante entre la linguistique du discours, l’ingénierie documentaire et le TAL. Cette convergence prend des formes diverses, ainsi l’élaboration de nouveaux modes d’accès aux contenus des documents tend à mettre davantage l’accent sur l’exploitation de leur structuration discursive, l’application au discours des méthodes d’analyse de corpus implique de plus en plus l’appel à des techniques et à des instruments du TAL. Elle se manifeste par un nombre croissant d’études conjointes, conduisant à une fertilisation croisée des disciplines.

* Linguistiques du texte et du discours Construire une interprétation cohérente du discours implique de délimiter des segments et de déterminer des relations hiérarchiques et sémantico-pragmatiques entre ces segments. Ces processus peuvent être abordés à travers la notion de relations de discours (cf. RST, SDRT), de thème ou topique, d’encadrement du discours, etc. Un défi pour le domaine est d’identifier des corrélats linguistiques de fonctions discursives spécifiques, ce qui nécessite une approche en corpus, et la prise en compte des possibilités de variations liées au registre et au domaine de connaissance. D’autres travaux, encore peu nombreux mais prometteurs, s’intéressent davantage à la structure globale du document : rôle des titres, de la segmentation logique, de la forme matérielle des textes...

* Ingénierie documentaire et TALN L’accès à l’information contenue dans des documents numérisés est une problématique majeure de la recherche actuelle, et les approches récentes cherchent à mieux prendre en compte l’organisation des documents traités (par exemple leur structure thématique et rhétorique). De plus en plus d’applications sont concernées par cette évolution : résumé automatique, navigation documentaire, recherche d’information (en particulier pour l’extraction de passages à l’intérieur des documents sélectionnés). En outre, le développement de l’hypertexte et du document composite (texte-image par exemple) pose de nouvelles questions sur l’interaction entre différentes fonctions sémiotiques.

Les propositions de communications pour ce numéro spécial de TAL porteront sur ce qu’on pourrait appeler, en linguistique du discours, en TAL ou en ingénierie documentaire, le « niveau document » :

-  Le document est vu comme une unité fonctionnelle ; il est ancré dans une situation, et inscrit sur un support (quel qu’il soit) qui lui confère des caractéristiques matérielles qui participent de son usage et de sa signification ;

-  L’expression « niveau document » signale un intérêt marqué pour les structures à gros grain, ou structures dites « globales » (encadrement du discours, structuration "logique", découpage en sections, ...), ou pour les relations entre structures locales et structures globales (structure d’information, chaînes de référence, chaînes topicales, relations interpropositionnelles, etc.). Elle manifeste un intérêt particulier pour des approches « descendantes  », exploitant un ensemble d’indices et de marqueurs.

THEMES

Parmi les thèmes pertinents, on peut notamment citer :
-  Analyses de structures discursives ;
-  Analyses de la structure de documents composites (texte-images, texte-graphiques...) ;
-  Impact de la structuration en hyper-texte et hyper-document sur notre appréhension du « fonctionnement » du document. Problèmes de la mise en hyper-texte et des aides informatiques par des procédures de TAL ;
-  Modèles de lecture et organisation discursive ;
-  Expérimentation informatique comme manière d’observer et d’expérimenter des hypothèses sur corpus ;
-  Etudes de corpus en amont : identification et annotation de structures discursives ;
-  Dispositifs informatiques pouvant aider à ces études dans une démarche expérimentale (formalisation des connaissances linguistiques, capitalisation des ressources, articulation des traitements, visualisation des annotations) ;
-  Articulation entre des approches utilisant des marques linguistiques, des connaissances du domaine, des techniques statistiques ;
-  Applications : recherche d’information intradocumentaire, aide à la navigation, résumé automatique ou assisté, synthèse de document...

LA REVUE

La revue TAL (Traitement Automatique des Langues) est une revue internationale éditée depuis 1960 par l’ATALA (Association pour le Traitement Automatique des Langues) avec le concours du CNRS. Elle va maintenant être publiée sous format électronique, avec impression à la demande. Cela ne change aucunement son processus de relecture et de sélection.

LANGUE

Les articles sont écrits en français ou en anglais. Les soumissions en anglais ne sont acceptées que pour les auteurs non francophones.

DATES IMPORTANTES

01/09/2006 Date limite de soumission
23/10/2006 Décision du comité
30/11/2006 Version révisée

FORMAT

Les articles (25 pages maximum, format PDF) seront envoyés aux deux rédactrices invitées aux adresses suivantes : Marie-Paule Péry-Woodley Donia Scott Les feuilles de style sont disponibles en ligne sur le site : http://tal.e-revues.com/appel.jsp

COMITE DE LECTURE SPECIFIQUE

N. Asher (IRIT, U. Toulouse 3, France)
J. Bateman (U. Bremen, Germany)
Y. Bestgen (U. C. Louvain, Belgium)
N. Bouayad-Agha (U. Pompeu Fabra, Barcelona, Spain)
M. Charolles (U. Paris 3, France)
D. Cristea (U. Iasi, Romania)
L. Danlos (U. Paris 7, France)
L. Degand (U. C. Louvain, Belgium)
P. Enjalbert (U. Caen, France)
S. Ferrari (U. Caen, France)
B. Grau (U. Paris-Sud, France)
N. Hernandez (GREYC, U. Caen, France)
J. Karlgren (Swedish Institute of Computer Science, Sweden)
G. Lapalme (U. Montréal, Québec, Canada)
N. Lucas (GREYC, U. Caen, France)
A. Max (U. Paris-Sud, France)
J.-L. Minel (U. Paris 4, France)
R. Power (Open University, England)
H. Saggion (U. Sheffield, England)
S. Teufel (U. Cambridge, England)


Computational Approaches to Discourse and Document Processing

SPECIAL ISSUE OF THE JOURNAL "TRAITEMENT AUTOMATIQUE DES LANGUES" (TAL)

Deadline for submission : September 22, 2006

GUEST EDITORS : Marie-Paule Péry-Woodley (ERSS - Université de Toulouse 2, France) and Donia Scott (Open University, UK)

FIRST CALL FOR PAPERS

This special issue of TAL is devoted to what we perceive as an increasing convergence between discourse linguistics, document engineering and NLP. Such a convergence can be observed from several angles ; for example, new modes of access to documents’ contents place greater emphasis on exploiting discourse structure ; applying corpus analysis methods to discourse calls for greater use of NLP techniques. It is manifest in the increasing number of joint studies, and results in cross fertilisation of the disciplines.

* Text and discourse linguistics Constructing a coherent interpretation of discourse involves delimiting segments, and identifying semantico-pragmatic relations and structures that bind them. These processes may be approached via the notions of discourse relations (cf. RST, SDRT), of theme or topic, of discourse framing, etc. A major challenge for the field is to identify linguistic correlates of specific discourse functions in text corpora, taking into account potential register- and domain-linked variation. Another promising research area focuses on the global structure of documents : role of titles, "logical structure", or layout, to name a few.

* Document engineering and NLP Access to the information stored in electronic documents is a major issue, and recent approaches seek to take better account of the organisation of the documents being processed - such as their thematic and rhetorical structure. A growing number of applications are concerned by this evolution : automatic summarisation, document browsing, information retrieval (e.g. for passage extraction from selected documents). In addition, hypertextual and composite documents raise new questions about the interaction between semiotic functions (text-image for instance).

For this special issue of TAL, we invite papers from researchers working in the fields of discourse linguistics, computational linguistics and document engineering on what can be termed the "document level", whereby :
-  the document is envisaged as a functional unit, situated in a specific setting, and actualised in a medium (whatever its nature) which confers on it material characteristics which are an integral part of the use and sense made of it ;
-  the expression "document level" signals a marked interest in coarse grain structures, or "global" structures (so-called "logical" structure, document structure, organisation in sections...), or in the interaction between local and global structures (reference chains, topical chains, inter-propositional relations, etc.). It indicates a specific interest in "top down" approaches based on the exploitation of surface cues or markers.


Date de dernière mise à jour : 1er octobre 2007, auteur : Béatrice Daille, Rédacteurs en chef.