« Hésitations, disfluences, répétitions, faux départs : quel ordre dans le désordre ? »

Date limite des soumissions : 2 février 2005

Réponse aux auteurs : 2 mars 2005

Le début des études linguistiques sur des corpus d enregistrements oraux non lus dans les années 50 a eu comme conséquence l émergence de toute une problématique des phénomènes dits d hésitation qui ont dû être posés comme objets d étude. Les linguistes et les spécialistes de la parole ont tenté depuis de trouver des représentations de ces phénomènes aussi bien dans les transcriptions que dans les modèles syntaxiques, d en décrire les régularités formelles ou quantitatives.

Plus récemment du côté du TAL (Traitement Automatique des Langues) et plus particulièrement du côté du traitement automatique de la parole, les chercheurs travaillant en reconnaissance automatique de la parole ont été obligés à se pencher sur la question. En effet, les corpus de parole spontanée sont caractérisés par la présence massive de ces phénomènes de disfluences, dont on n a pas encore décrit avec précision la fonction (hésitation, réparation, travail de formulation, recherche dans la mémoire, malaise, effets de style, marques facilitant le droit à la parole, etc.)

Malgré l apparente irrégularité de ces phénomènes, malgré leur diversité, des constantes se dégagent à travers l observation de corpus de même type, ou d une même langue, voire de plusieurs langues. Certaines constantes pourraient être universelles.

Le but de cette journée est de construire des convergences entre les chercheurs qui s intéressent à ces phénomènes afin d avancer vers de possibles modélisations exploitables en traitement automatique. Les présentations d études en cours, non encore finalisées, d hypothèses inédites en cours de vérification sont les bienvenues.

Toutes les réflexions allant dans le sens de l organisation des phénomènes dits d hésitation sont intéressantes pour cette journée. Axes donnés à titre indicatif :

  • Régularités phonétiques, prosodiques ou syntaxiques des phénomènes dits d hésitation
  • Contraintes phonotactiques, prosodiques ou syntaxiques qui pèsent sur l apparition de ces phénomènes
  • Régularités intra ou inter-langues
  • Propositions de modélisation intra ou inter-langue
  • Régularités déjà utilisés en TAL : descriptions, modélisations, évaluations
  • Corpus de parole spontanée : transcriptions et annotations des disfluences
  • Disfluences et intelligibilité pour la synthèse (effet de la présence / absence des disfluences en parole spontanée sur l intelligibilité ; tests de perception)
  • Disfluences : phénomènes de rupture et/ou de « jonction » ?
  • Hésitations et L2
  • etc.

La littérature anglophone et anglo-centrée étant particulièrement abondante sur ces questions, seront privilégiées les études portant sur des langues autres que l anglais. Néanmoins, toute comparaison avec les études sur l anglais sera la bienvenue. Nous conseillons de préciser clairement le type de corpus étudié (parole lue, préparée, spontanée) et la situation de communication (exposé, récit, dialogue privé, débat privé, débat radiodiffusé, etc.). La journée s’intéresse aux disfluences de la parole « normale », mais les communications concernant la parole pathologique peuvent être acceptées dans la mesure où elles illustrent le rapport entre parole pathologique et parole normale.

Comité d organisation :

  • Maria Candea (EA 1483 Univ. Paris 3)
  • Ioana Vasilescu (TSI ENST)
  • Martine Adda-Decker (LIMSI)

Comité scientifique :

  • Gilles Adda (LIMSI)
  • Claude Barras (LIMSI)
  • Philippe Boula de Mareüil (LIMSI)
  • Laurence Devillers (LIMSI)
  • Danielle Duez (LPL, Aix-en-Provence)
  • Benoît Habert (Univ. Paris 10/LIMSI)
  • Daniel Luzzati (LIUM, Univ. Le Mans)
  • Mary-Annick Morel (Univ. Paris 3)
  • Jacqueline Vaissière (ILPGA, Univ. Paris 3)
  • Ioana Vasilescu (ENST TSI)
  • Jean Véronis (DELIC, Univ. de Provence)

Soumissions d’un résumé (max. 2500 signes) par courrier électronique envoyé à Maria Candea avant le 2 février 2005.

Les résumés larges seront publiés après la Journée sur le site de l'ATALA.

Programme
9h30-10h20 Maria Candé, Ioana Vasilescu,Martine Adda Introduction : présentation de la problématique en linguistique, en acoustique, en traitement automatique des langues
10h20-10h45 Pause café
Perspective linguistique
10h45-11h10 Elgar-Paul Magro, Univ. Paris 3 Que vient nous apprendre la mimo-gestuelle sur les hésitations en parole spontanée ? Etude de cas sur le français
11h10-11h35 Berthille Pallaud, Parole et Langage, Univ. de Provence Amorces de mots et réajustements
11h35- 12h00 Giovanni Depau, Univ. Grenoble La particule cioè en italien : continuité et discontinuité dans le discours
12h00-12h15 Virginie Guarnerio, Univ. Paris 3 « J’ai un objectif, celui de vous convaincre » : le travail de formulation dans un échange oral spécifique, la simulation d’entretien d’embauche (exposé de projet d’étude)
12h15-14h15 Pause déjeuner
Perspective TAL
14h15-14h40 G. Adda, M. Adda-Decker, Claude Barras, P. Boula de Mareüil, B. Habert, P. Paroubek (LIMSI) Disfluences et traitement automatique : l’heure de vérité
14h40-15h05 Jean-Léon Bouraoui - Nadine Vigouroux, IRIT Phénomènes de disfluences dans un corpus d’apprentissage (contrôleurs aériens)
15h05-15h30 Jean-Yves Antoine (LI, Université de Tours) Jérôme Goulian (CLIPS-IMAG, UPMF), Sabine Letellier (VALORIA, UBS) Parole spontanée et variation d’ordre linéaire en français : régularités syntaxiques et difficultés pour le dialogue oral homme-machine
15h30-15h45 Pause café
Réflexion sur la pathologie
15h45-16h10 M-C Monfrais-Pfauwadel, Hopital européen Georges Pompidou Y a-t-il un intérêt nosologique à classifier les disfluences pathologiques ?
16h10-16h35 Amina Bensalah, LEAPLE, Univ. Paris 5 Disfluences ordinaires et bégayages pathologique : différence structurelle ou phénoménale ?
16h10-17h00 Discussion
Date
2 avril 2005
Lieu

ENST
46, rue Barrault
75013 Paris
France

E-mail de contact
maria.candea@univ-paris3.fr
Organisation
Maria Candea (EA 1483 Paris 3)
Ioana Vasilescu (ENST CNRS)
Martine Adda-Decker (LIMSI CNRS)