Date limite des soumissions : 2 février 2005
Réponse aux auteurs : 2 mars 2005
Le début des études linguistiques sur des corpus d enregistrements oraux non lus dans les années 50 a eu comme conséquence l émergence de toute une problématique des phénomènes dits d hésitation qui ont dû être posés comme objets d étude. Les linguistes et les spécialistes de la parole ont tenté depuis de trouver des représentations de ces phénomènes aussi bien dans les transcriptions que dans les modèles syntaxiques, d en décrire les régularités formelles ou quantitatives.
Plus récemment du côté du TAL (Traitement Automatique des Langues) et plus particulièrement du côté du traitement automatique de la parole, les chercheurs travaillant en reconnaissance automatique de la parole ont été obligés à se pencher sur la question. En effet, les corpus de parole spontanée sont caractérisés par la présence massive de ces phénomènes de disfluences, dont on n a pas encore décrit avec précision la fonction (hésitation, réparation, travail de formulation, recherche dans la mémoire, malaise, effets de style, marques facilitant le droit à la parole, etc.)
Malgré l apparente irrégularité de ces phénomènes, malgré leur diversité, des constantes se dégagent à travers l observation de corpus de même type, ou d une même langue, voire de plusieurs langues. Certaines constantes pourraient être universelles.
Le but de cette journée est de construire des convergences entre les chercheurs qui s intéressent à ces phénomènes afin d avancer vers de possibles modélisations exploitables en traitement automatique. Les présentations d études en cours, non encore finalisées, d hypothèses inédites en cours de vérification sont les bienvenues.
Toutes les réflexions allant dans le sens de l organisation des phénomènes dits d hésitation sont intéressantes pour cette journée. Axes donnés à titre indicatif :
- Régularités phonétiques, prosodiques ou syntaxiques des phénomènes dits d hésitation
- Contraintes phonotactiques, prosodiques ou syntaxiques qui pèsent sur l apparition de ces phénomènes
- Régularités intra ou inter-langues
- Propositions de modélisation intra ou inter-langue
- Régularités déjà utilisés en TAL : descriptions, modélisations, évaluations
- Corpus de parole spontanée : transcriptions et annotations des disfluences
- Disfluences et intelligibilité pour la synthèse (effet de la présence / absence des disfluences en parole spontanée sur l intelligibilité ; tests de perception)
- Disfluences : phénomènes de rupture et/ou de « jonction » ?
- Hésitations et L2
- etc.
La littérature anglophone et anglo-centrée étant particulièrement abondante sur ces questions, seront privilégiées les études portant sur des langues autres que l anglais. Néanmoins, toute comparaison avec les études sur l anglais sera la bienvenue. Nous conseillons de préciser clairement le type de corpus étudié (parole lue, préparée, spontanée) et la situation de communication (exposé, récit, dialogue privé, débat privé, débat radiodiffusé, etc.). La journée s’intéresse aux disfluences de la parole « normale », mais les communications concernant la parole pathologique peuvent être acceptées dans la mesure où elles illustrent le rapport entre parole pathologique et parole normale.
Comité d organisation :
- Maria Candea (EA 1483 Univ. Paris 3)
- Ioana Vasilescu (TSI ENST)
- Martine Adda-Decker (LIMSI)
Comité scientifique :
- Gilles Adda (LIMSI)
- Claude Barras (LIMSI)
- Philippe Boula de Mareüil (LIMSI)
- Laurence Devillers (LIMSI)
- Danielle Duez (LPL, Aix-en-Provence)
- Benoît Habert (Univ. Paris 10/LIMSI)
- Daniel Luzzati (LIUM, Univ. Le Mans)
- Mary-Annick Morel (Univ. Paris 3)
- Jacqueline Vaissière (ILPGA, Univ. Paris 3)
- Ioana Vasilescu (ENST TSI)
- Jean Véronis (DELIC, Univ. de Provence)
Soumissions d’un résumé (max. 2500 signes) par courrier électronique envoyé à Maria Candea avant le 2 février 2005.
Les résumés larges seront publiés après la Journée sur le site de l'ATALA.
9h30-10h20 | Maria Candé, Ioana Vasilescu,Martine Adda | Introduction : présentation de la problématique en linguistique, en acoustique, en traitement automatique des langues |
10h20-10h45 | Pause café | |
Perspective linguistique | ||
10h45-11h10 | Elgar-Paul Magro, Univ. Paris 3 | Que vient nous apprendre la mimo-gestuelle sur les hésitations en parole spontanée ? Etude de cas sur le français |
11h10-11h35 | Berthille Pallaud, Parole et Langage, Univ. de Provence | Amorces de mots et réajustements |
11h35- 12h00 | Giovanni Depau, Univ. Grenoble | La particule cioè en italien : continuité et discontinuité dans le discours |
12h00-12h15 | Virginie Guarnerio, Univ. Paris 3 | « J’ai un objectif, celui de vous convaincre » : le travail de formulation dans un échange oral spécifique, la simulation d’entretien d’embauche (exposé de projet d’étude) |
12h15-14h15 | Pause déjeuner | |
Perspective TAL | ||
14h15-14h40 | G. Adda, M. Adda-Decker, Claude Barras, P. Boula de Mareüil, B. Habert, P. Paroubek (LIMSI) | Disfluences et traitement automatique : l’heure de vérité |
14h40-15h05 | Jean-Léon Bouraoui - Nadine Vigouroux, IRIT | Phénomènes de disfluences dans un corpus d’apprentissage (contrôleurs aériens) |
15h05-15h30 | Jean-Yves Antoine (LI, Université de Tours) Jérôme Goulian (CLIPS-IMAG, UPMF), Sabine Letellier (VALORIA, UBS) | Parole spontanée et variation d’ordre linéaire en français : régularités syntaxiques et difficultés pour le dialogue oral homme-machine |
15h30-15h45 | Pause café | |
Réflexion sur la pathologie | ||
15h45-16h10 | M-C Monfrais-Pfauwadel, Hopital européen Georges Pompidou | Y a-t-il un intérêt nosologique à classifier les disfluences pathologiques ? |
16h10-16h35 | Amina Bensalah, LEAPLE, Univ. Paris 5 | Disfluences ordinaires et bégayages pathologique : différence structurelle ou phénoménale ? |
16h10-17h00 | Discussion |
ENST
46, rue Barrault
75013 Paris
France