La productivité morphologique

La présente journée est consacrée à la question de la productivité morphologique dans le domaine du lexique construit.

La productivité des règles de construction de lexèmes peut être abordée sous deux aspects complémentaires, l’un qualitatif, l’autre quantitatif.

D’un point de vue qualitatif, une règle de construction de lexèmes, conçue ici comme un patron exprimant la généralisation de données observables, est dite productive quand de nouveaux lexèmes, jamais produits auparavant ou inconnus du locuteur qui les a produit, peuvent l’instancier. La difficulté, avec cette définition, est qu’elle nécessite de mettre en place des outils pour estimer la productivité d’une règle donnée, étant entendu que l’intuition du locuteur, fût-il linguiste, n’est pas un guide fiable. Ces dernières années, la principale avancée sur cette question ne concerne pas tant la définition de la notion elle-même que, précisément, la proposition de mesures permettant de l’objectiver et de dépasser la simple intuition. Or, ces mesures requièrent des compétences diverses et complémentaires, pouvant impliquer des chercheurs en linguistique théorique, en traitement automatique des langues, en statistiques et en psycholinguistique.

L’apport du traitement automatique des langues consiste, à partir d’un corpus donné, à opérer un premier tri et à préparer les données sur lesquelles portera l’analyse. Souvent, on utilise pour ceci des traitements classiques du TAL, comme la segmentation, l’étiquetage morpho-syntaxique ou la lemmatisation. Mais, lorsque les outils qui effectuent l’analyse morphologique des lexèmes sont disponibles, ils peuvent également intervenir dans la tâche et aider l’étape ultérieure de sélection humaine des lexèmes construits. Les outils de ce type, par exemple Derif (Namer, 2003), sont rares mais leur apport est indéniable.

L’apport du TAL est aussi de permettre, une fois qu’il a été statué sur les données, d’automatiser les calculs de la productivité.

L’apport essentiel des spécialistes en morphologie, sémantique et psycholinguistique consiste à statuer sur les lexèmes retenus à l’issue de la phase précédente. Lors de la sélection, on peut distinguer par exemple les lexèmes (i) qui instancient effectivement le patron étudié, (ii) les emprunts, (iii) les lexèmes dans lesquels le procédé étudié n’est pas la dernière opération morphologique, (iv) ceux dans lesquels il joue un rôle purement formel, etc

Soumissions :

Toute proposition en rapport avec la thématique de la journée sera examinée. Il pourra s’agir de recherches portant sur : • l’étude de la productivité d’une règle de construction de lexèmes donnée, • une comparaison entre la productivité de règles de constructions de lexèmes différentes, • la pertinence d’opposer règles de construction de lexèmes et règles de réalisation de lexèmes quant à leur productivité, • une discussion des mesures existantes ou sur la proposition d’autres façons de mesurer la productivité morphologique. On pourra aussi se demander : • si l’étude de la productivité en morphologie requiert des approches et ressources qui lui sont propres, ou si l’on peut réutiliser l’outillage méthodologique et logiciel développé pour d’autres besoins du TAL (étiqueteurs, lemmatisateurs, etc.), • dans quelle mesure les outils qui ont développés pour l’analyse en morphologie (Dérif, Flemm, Automorphology, etc.) sont utilisables pour l’étude de la question de la productivité en morphologie, • etc. Les soumissions portant sur le point de vue psycholinguistique sur la question seront également les bienvenues. Les langues de communication seront le français et, au besoin, l’anglais.

Conférencier invité : Harald Baayen, University of Alberta Edmonton, Canada

Format et envoi des soumissions

Modalités de soumission :

1) Un résumé anonyme (en français ou en anglais) ne dépassant pas 1500 mots, bibliographie non comprise, l’ensemble (résumé + bibliographie) ne dépassant pas 5 pages format A4 corps Times 12. Le résumé devra spécifier clairement le sujet traité et les conclusions principales établies en faisant référence aux travaux antérieurs sur la question. Les données les plus centrales, qui permettent d’étayer vos conclusions, devront être citées.

2) Une page séparée mentionnant vos nom et prénom, votre appartenance administrative, votre adresse postale, votre statut, votre courriel et le titre de votre contribution.

Les soumissions seront envoyées par courrier électronique, de préférence au format .pdf, à productivite@linguist.jussieu.fr. Veillez à envoyer le résumé et la page où figurent les renseignements personnels sous des fichiers attachés distincts, le premier étant nommé nom.abstact.pdf et le second nom.perso.pdf, où "nom" est le nom de l’auteur de la soumission ou de l’auteur qui sert de contact en cas d’auteurs multiples).

Délai de rigueur : 1er octobre 2007. (On acceptera un seul résumé à titre d’auteur unique, et un en collaboration.

Les soumissions seront expertisées par le comité de lecture en double anonymat.

Dates importantes :

01/10/2007 : date limite de réception des soumissions 15/10/2007 : notification aux auteurs 10/11/2007 : journée

Comité d’organisation

Georgette Dal (STL, CNRS & Université de Lille), Bernard Fradin (LLF, CNRS & Université de Paris 7) Natalia Grabar (Centre de recherche des Cordeliers, Université de Paris 6, INSERM, Paris)

Comité de lecture :

Nabil Hathout (CLLE-ERSS, CNRS & Université de Toulouse Le Mirail), Stéphanie Lignon (ATILF CNRS & Nancy Université), Fanny Meunier (UMR 5596, CNRS & Université de Lyon, Université de Constance), Fiammetta Namer (ATILF CNRS & Nancy Université), Clément Plancq (LLF, CNRS & Université Paris 7), François Yvon (GET/ENST), Pierre Zweigenbaum (LIMSI, CNRS).

Programme
  • 10h-10h45 : Joanna Rabiega Wisniewska, Institute of Computational Science Polish Academy of Sciences, Warsaw, Poland Linguistic tests of productivity for Polish
  • 10h45-11h : pause café
  • 11h-11h45 : Bruno Cartoni, ISSCO/TIM ETI, Université de Genève, Suisse, Mesurer l’alternance entre préfixes, en combinant méthodes contrastives et étude empirique : le cas des préfixes de pluralité indéterminée
  • 11h45-12h30 : Georgette Dal, Bernard Fradin, Natalia Grabar, Stéphanie Lignon, Fiammetta Namer, Clément Plancq, François Yvon, Pierre Zweigenbaum, GDR 220, CNRS, France, Quelques préalables au calcul de la productivité des règles constructionnelles
  • 12h30-14h : pause déjeuner
  • 14h-14h45 : Sylvain Loiseau, LIMSI-CNRS, France, Caractériser trois discours par leur productivité morphologique
  • 14h45-15h30 : Greg Lessard, Michael Levion, Craig Thomas, Queen’s University, Kingston ; Ontario, Canada, The contribution of Natural Language Generation and corpus data to the study of derivational productivity
  • 15h30-15h45 : pause café
  • 15h45-16h45 : Harald Baayen, University of Alberta Edmonton, Canada and Ingo Plag, Universität Siegen, Germany, Parsing is not weaknessless : suffix ordering revisited
  • 16h45-17h30 : Ahmad Zaharani, Universiti Kebangsaan, Bangi, Selangor, Malaysia, The Productivity of Morphological Redundancy in Malay : An Analysis of the DBP Corpus
  • 17h30 : fin de la journée

Transparents

Date
10 novembre 2007
Lieu

ENST
46, rue Barrault
Amphi Emeraude
75013 Paris
France

Organisateur(s)
Georgette Dal (UMR 8163 « STL », U Lille 3 et Lille 1)
Bernard Fradin (UMR 7110, CNRS & U Paris 7)
Natalia Grabar (Inserm, UMR_S 872 Paris; HON Genève)