Histoire de l’ATALA

ATALA, cinquante ans.

Jacqueline Léon, CNRS, Université Paris-Diderot, Histoire de Théories Linguistiques

Les dates-clés :


1959 : création de l’ATALA (Association pour l’étude et le développement de la Traduction Automatique et de la Linguistique Appliquée)

1960 : début des séminaires et création de la revue La Traduction Automatique, dont le directeur est le fondateur et président de l’ATALA, Emile Delavenay. La revue est bimestrielle et est fabriquée alternativement par les compagnies Bull et IBM.

1961 : la revue se dote d’un éditeur-diffuseur, Mouton, et devient trimestrielle.

1962 : création de l’AMTCL qui deviendra l’ACL en 1973.

1962: organisation par l’ATALA du colloque « Le mot ».

1965 suite au rapport de l’ALPAC et à la crise internationale de la traduction automatique, l’ATALA devient l ’Association pour le Traitement Automatique des Langues. La revue change de nom : TA Informations, Revue internationale du traitement automatique du langage devient bi-annuelle et ouvre ses pages à l’AILA. Elle passe du format 21 x 27 au format 15,5 x 24 et est diffusée par Klincksieck.

1965 : premier Coling à New York, coorganisé par l’ATALA.

1966 : première subvention du CNRS pour financer la revue TA Informations.

1967 : second Coling, organisé par l’AMTCL et l’ATALA, à Grenoble en août 1967 sous le nom de " deuxième conférence en traitement automatique des langues ".

1971 : la revue TA Informations change de format et adopte le format A4.

1973 : les séminaires de l’ATALA se divisent en deux thèmes distincts : analyse automatique des langues et application de l’informatique à l’enseignement des langues vivantes. Cette partition sera éphémère.

1976 : journée « Linguistique et informatique : où en sommes-nous en 1976 ? » organisée notamment par Christian Boitet, Marcel-Paul Schutzenberger, Jean-Pierre Desclés.

1982: journée « Statistique et linguistique » organisée par Théodore Guilbaud et Pierre Lafon

1983 : généralisation des journées d’études de l’ATALA d’une durée de un à deux jours.

1984-1989 : années noires. Alors que, depuis les années 1960, l’ATALA comptait en moyenne une centaine d’adhérents, ce nombre commence à décliner en 1984. De 1985 à 1992, il n’y aura en moyenne qu’une soixantaine d’adhérents. Le CNRS suspend sa subvention en 1986. La parution de la revue a plusieurs années de retard. Klincksieck, le diffuseur, ne paie pas ses dettes. Le nombre d’adhérents est ensuite remonté pour atteindre 200 adhérents en 1994, puis plus de 300 en 2001.

1990 : création du bulletin électronique LN par Jean Véronis et Pierre Zweigenbaum.

1993 : création du bulletin LN-FR avec comme modérateurs André Molia et Pierre Zweigenbaum.

1993 : la revuechange une troisième fois de nom pour s’appeler TAL (Traitement Automatique des Langues) et passe du format A4 au format 15x22. Le premier numéro de cette nouvelle série est lenuméro 1992, 33-1/2, consacré au trentenaire de l’association.

1994 : création de la conférence annuelle TALN (Traitement Automatique des Langues Naturelles) par Philippe Blache sous l’égide du GdR-PRC « communication homme-machine ».

1996 : création du colloque des jeunes chercheurs RECITAL.

1996 : création du premier site WEB de l’ATALA sous la responsabilité de Pierre Zweigenbaum.

1997 : numéro de TAL sur l’état de l’art dirigé par Laurence Danlos et Jean Véronis.

1998: obtention du contrat TISTIL par Laurence Danlos, présidente de l’ATALA, auprès du Ministère de l’Éducation Nationale, de la Recherche et de la Technologie.

1999 : TALN passe sous l’égide de l’ATALA. RECITAL devient une session de TALN. L’ATALA se trouve ainsi dotée d’un statut proche de l’ACL avec trois comités : le conseil d’administration de l’association, le comité de rédaction de la revue et le comité permanent du colloque annuel.

1999: LN et LN-FR passent sous l’égide de l’ATALA.

2000 : La revue TAL change d’éditeur et passe de Klinscksieck à Hermès Sciences, racheté en 2003 par Lavoisier. Le nombre de numéros passe de deux à trois par an. Les journées d’étude font l’objet d’appels à communications.

2001 : la revue TAL comporte trois rédacteurs en chef, et le comité de rédaction devient international.

2001 : le site WEB est remanié et étendu pour devenir un portail technologique bilingue (anglais, français) en traitement automatique des langues et en ingénierie linguistique en France, grâce au financement du contrat TISTIL.

2001 : fondation du groupe REPTIL par Jean Véronis, président de l’ATALA, chargé de l’inventaire des formations en linguistique informatique.

2002 : création de l’association APIL complémentaire de l’ATALA.

2003-2005: recrutement d’un salarié pour l’administration de l’association.

2003: ouverture du portail Technolangue.net, point d’entrée d’un anneau d’information électronique reliant les sites de l’ATALA, l’ELDA, l’AFCP, l’APIL et l’AFNOR, grâce au financement par un second contrat obtenu par l’ATALA. Un web-master est recruté pour remanier entièrement le site de l’association.

2003 : RECITAL se dote d’un Comité associé à l’ATALA, analogue au Comité permanent de TALN. Extension du site de l’ATALA avec le projet OrbiTal consacré aux jeunes chercheurs.

2004: fusion des deux listes LN et LN-FR

2006 : le site web est augmenté d’un projet d’encyclopédie collaborative sur le traitement automatique des langues (AtalaPedie) sur le modèle des MediaWiki (Wikipedia).

2006 : la revue TAL devient entièrement électronique et le contrat avec Lavoisier est dénoncé.

Les années pionnières : 1960-1965


L’Association pour l’étude et le développement de la Traduction Automatique et de la Linguistique Appliquée (ATALA) est créée le 30 septembre 1959. Elle succède à un petit groupe international d’études sur la traduction automatique créé en 1958 à l’UNESCO par Emile Delavenay, et est fondée à la suite du Congrès sur la Traduction automatique organisé par l’UNESCO en juin de la même année. Fin 1960, elle comprendra une centaine de membres.

L’ATALA constitue la première institutionnalisation en France du traitement automatique des langues en France - le terme, utilisé pour la première fois par Bernard Vauquois, n’apparaît toutefois qu’en 1967 après celui de « traitement automatique du langage », apparu en 1965 comme sous-titre de la revue T.A. Informations. La création de l’ATALA précède de peu celle d’un Centre d’Etudes pour la Traduction Automatique, en 1960, au CNRS, comprenant deux sections : une section parisienne, le CETAP, dirigée par Aimé Sestier et une section grenobloise, le CETAG, dirigée par Bernard Vauquois qui deviendra président de l’ATALA en 1966. A noter que la France affiche un certain retard dans le domaine, puisque les premières recherches sur la Traduction Automatique sont menées en Grande-Bretagne dès 1948 et aux Etats-Unis dès 1949 [9].

L’ATALA se donne comme thèmes d’étude : la traduction automatique, la linguistique pure, la linguistique appliquée, l’automatique documentaire et les statistiques lexicales.

En avril 1960 paraît le n°1 de La Traduction Automatique, bulletin bimestriel de l’ATALA, sous la direction du président de l’ATALA, E. Delavenay [5]. La TA a l’ambition de devenir une revue internationale et de faire pendant à la revue américaine Mechanical Translation, fondée au MIT en 1954. La Traduction Automatique se veut moins une revue scientifique qu’un bulletin de liaison, d’informations et de formation. Elle rend compte de façon systématique de toute manifestation et de toute publication dans le domaine du traitement non numérique de l’information.

L’organisation de l’ATALA en trois comités se réunissant régulièrement une à deux fois par mois, à l’UNESCO, en fait un véritable groupe de recherches potentiel. Le comité 1 se consacre à la traduction mécanique de l’anglais-français ; le comité 2, dit de "prospection linguistique", examine les problèmes que posent, pour la traduction automatique, les diverses langues, notamment les "langues de l’Asie". Le comité 3 se charge de la documentation et de la bibliographie.

Bien que la traduction automatique et l’étude des langages formels soient tenues à l’écart du cercle de la linguistique officielle, l’ATALA comprend de nombreux linguistes parmi ses membres et est un des lieux de pénétration en France de la linguistique américaine et des langages formels.

L’ATALA collabore de façon étroite avec deux groupes, le Séminaire de Linguistique Quantitative créé par Jean Favard à l’Institut Henri Poincaré en mars 1960, et le Groupe de mathématique sociale et de statistique créé en 1958 par Théodore Guilbaud à l’EPHE 6ème section, à l’origine de la revue Mathématiques et Sciences Humaines créée en 1962 avec Marc Barbut. Collaborations qui témoigne de l’engagement des mathématiciens dans le traitement automatique des langues à ses débuts.

En 1961-62, les trois groupes se partageaient la tâche : « l’ATALA traitera des questions linguistiques qui ne requièrent pas d’appareil mathématique important. Le séminaire Favard traitera de ces questions dans leurs aspects mathématiques ou théoriques. Le séminaire Guilbaud, étudiant le rôle des mathématiques dans toutes les sciences humaines, traitera éventuellement de linguistique ».

De 1960 à 1971, l’ATALA organise en moyenne de cinq à huit séminaires (appelés conférences) par an avec l’intervention d’un conférencier. Les deux premiers séminaires de 1960 sont donnés par deux ingénieurs d’IBM-France, Robert Tabory et Francis Levery sur l’« utilisation d’une grande calculatrice électronique en linguistique appliquée » et « dans les domaines du langage et de la documentation ». Les industriels sont alors très présents à l’ATALA. La Traduction Automatique est fabriquée alternativement par les Compagnies Bull et IBM. Un peu plus tard, René Moreau, directeur scientifique d’IBM à partir de 1961, jouera un rôle important -le service scientifique d’IBM comprenait alors 110 personnes dont 30 agrégés de mathématiques et 10 littéraires.

Jusqu’en 1965, bien que la traduction automatique soit un thème largement abordé dans les séminaires, il n’est pas le seul. Sont discutées différentes méthodes de l’automatisation du langage, que ce soit son traitement algébrique (les structures syntaxiques) ou probabiliste (les aspects codiques du langage) ou encore les questions d’interface homme-machine orientée vers l’enseignement, alors nommée « moyens de communication entre l’homme et les calculatrices ». Les conférenciers sont des linguistes comme Jean Fourquet et Antoine Culioli, des mathématiciens comme René Moreau, André Lentin, René de Possel, Jean-Pierre Benzécri, Yves Gentilhomme, des physiciens-informaticiens comme Bernard Vauquois, des archéologues comme Jean-Claude Gardin.

A noter que les aspects strictement techniques sont aussi présents dans les séminaires de l’ATALA, un des plus urgents à résoudre étant la reconnaissance des caractères écrits, ainsi que les aspects pratiques comme la recherche documentaire.

La crise : 1963-1965


Le déclin de la Traduction Automatique, amorcé depuis 1960 aux Etats-Unis par le rapport Bar-Hillel et accentué avec la publication du rapport de l’ALPAC en 1963 déclenche une crise au sein de l’ATALA. En 1963, Yehoshua Bar-Hillel est invité par l’ATALA et ses conférences « Pourquoi les calculatrices n’apprendront pas à traduire correctement » et « Quel est le prix de la simplification syntaxique ? » témoignent des difficultés de la TA aux Etats-Unis tout en mettant en garde les chercheurs français sur l’illusion de la FAHQT ( Full Automated High Quality Translation ).

Toujours en 1963, le président Delavenay émet le souhait que les activités de l’ATALA ne se limitent pas à la TA et propose des thèmes plus généraux comme « linguistique et électronique » ou « traitement automatique de l’information non numérique ». Il s’agit aussi de sauver ce qui fait l’originalité de l’ATALA, à savoir rassembler dans une même association des personnes peu habituées à travailler en commun : mathématiciens, électroniciens, linguistes, documentalistes, spécialistes des sciences humaines. Ainsi, on décide d’élire en alternance un président issu des sciences (logicien, informaticien, mathématicien) et des sciences humaines (linguistes), pratique qui subsistera jusqu’à l’autonomisation du TAL en tant que tel dans les années 1990.

Lors de l’Assemblée Générale du 15 mai 1965, l’ingénieur général Nicolau plaide pour la survie de l’association : les échecs de la traduction automatique ne doivent pas entraîner la disparition de l’ATALA ni ralentir ses activités ; l’ATALA doit s’orienter résolument vers l’une de ses missions, le développement de la linguistique appliquée.

A l’issue de cette crise, ATALA deviendra le sigle de l’Association pour le Traitement Automatique des Langues et son bulletin La Traduction Automatique, deviendra TA Informations, Revue internationale du traitement automatique du langage. La revue passe du format 21 x 27 au format 15,5 x 24, est publiée par Klincksieck avec le concours du CNRS et devient bi-annuelle. Elle accepte des articles en français et en anglais.

Les thèmes se diversifient et laissent moins de place à la traduction automatique en tant que telle ; celle-ci apparaît sous une rubrique plus vaste intitulée « automatique documentaire, linguistique mathématique et traduction automatiqu »e. A.Dewèze en reste le rédacteur en chef, G.Gougenheim en devient le directeur.

Parallèlement, la revue Mechanical Translation s’appelle, à partir de 1965, Mechanical Translation and Computational Linguistic s. De 1974 à 1983, elle s’appellera American Journal of Computational Linguistics, puis à partir de 1984 Computational Linguistics.

Les linguistes : 1966-1981


En 1965, le premier Coling, co-organisé à New York par l’ATALA et l’AMTCL est une des manifestations de la reconversion à la linguistique computationnelle des groupes de recherche américains en traduction automatique.

Toutefois, la France fait figure d’exception. Alors qu’A.Sestier démissionne en 1962 et que le CETAP est dissous, le CNRS maintient des recherches en traduction automatique au CETA de Grenoble. C’est d’ailleurs à Grenoble que se tient en 1967 le second Coling, également co-organisé par l’AMTCL et l’ATALA, sous la dénomination de seconde conférence en traitement automatique des langues. Le terme est donné parBernard Vauquois, directeur du CETA, organisateur du colloque et président de l’ATALA de 1966 à 1971.

C’est pourquoi, pendant cette période, une partie des séminaires de l’ATALA consacrés à l’automatisation du langage restent rattachés à la traduction automatique. D’autres thèmes apparaissent toutefois comme l’automatisation de la chaîne sonore. De plus, un certain nombre de séminaires accueillent des exposés sur les travaux en linguistique mathématique des pays communistes, Chine et bloc soviétique.

Pendant cette période également, la revue TA Informations est consolidée grâce notamment à une subvention du CNRS obtenue en 1966 et qui sera accordée jusqu’en 2006 ( ??- voir secrétaire de l’ATALA de cette période).

De 1966 à 1981, ce sont les linguistes qui dominent. De nombreux séminaires sont consacrés à des questions de linguistique pure ou de linguistique formelle, en particulier à la formalisation sémantique (logique, théorie de l’énonciation).

Plusieurs raisons peuvent expliquer cette domination des linguistes. En 1965, la revue TA Informations ouvre ses colonnes à l’AILA, fondée en 1964, et présidée par Bernard Pottier également vice-président de l’ATALA. Les nouvelles de l’AILA occuperont un bon tiers de chaque livraison. En 1966, une journée d’étude « Quelques aspects de formalisation de la sémantique » est organisée par Bernard Vauquois en collaboration avec l’AFLA, filiale française de l’AILA.

La vice-présidence de l’association est occupée à partir de 1966 par deux linguistes : Bernard Pottier, déjà évoqué, qui deviendra président de l’ATALA en 1971, et Georges Gougenheim. C’est d’ailleurs à partir de 1972 que les séminaires gagnent en importance en passant à deux intervenants. De plus, en 1973, la linguistique appliquée occupe une place centrale quand les journées d’étude sont organisées selon deux thèmes : l’analyse automatique des langues et l’application de l’informatique à l’étude des langues vivantes. Mais cette division en deux thèmes restera sans suite.

La collaboration entre AFLA et ATALA retrouvera un regain d’énergie en 1996, à la demande d’Hélène Huot, présidente de l’AFLA, auprès de Laurence Danlos, présidente de l’ATALA. Une journée d’étude commune « Traduction humaine/ traduction automatique » est ainsi organisée cette même année par Jacqueline Guillemin-Flescher et Laurence Danlos.

Deux autres groupes travailleront en étroite collaboration avec l’ATALA pendant cette période. Le Centre de linguistique quantitative, qui prend la suite du Séminaire de Linguistique Quantitative, assure l’interaction entre linguistes et mathématiciens et la pénétration de la linguistique formelle en France, au travers notamment d’un enseignement de linguistique pour mathématiciens (André Martinet, Jean Dubois) et d’un enseignement de mathématiques, logique mathématique et théorie de l’information pour non-spécialistes (René Moreau et Daniel Hérault). En 1962-1963, un cours supplémentaire sur la théorie des langages sera assuré par Jacques Pitrat et Maurice Gross. Le cours de Maurice Gross fournira la matière de sa contribution à l’ouvrage publié en 1967 avec André Lentin, Notions sur les grammaires formelles,ouvrage central pourla ou les premières générations de linguistes qui se sont intéressées aux langages formels.

En 1968, un autre groupe entre en jeu : le séminaire de linguistique formelle de l’ENS d’Antoine Culioli qui deviendra président de l’ATALA en 1975. Celui co-organise avec le Centre de linguistique quantitative, alors dirigé par Daniel Hérault, un séminaire de linguistique formelle à Aiguilles qui rassemble des linguistes, mathématiciens et logiciens de plusieurs pays, en particulier des pays de l’ex-bloc soviétique et des Etats-Unis. Jean-Pierre Desclés (président de l’ATALA en 1980-81) et Catherine Fuchs en font le compte-rendu dans TA Informations, 1969-1.

Les premières journées d’étude de l’ATALA, qui font suite aux séminaires d’un ou deux intervenants, sont consacrées à la linguistique informatique. En 1976, une journée entière, consacrée au thème « linguistique et informatique » est organisée par Christian Boitet, Marcel-Paul Schützenberger et Jean-Pierre Desclés. Elle sera suivie de deux journées en 1981 « informatique et linguistique » organisées conjointement par l’ATALA et l’AFCET, sur le thème « Arbres en linguistique :un modèle informatique parmi d’autres » (J-P.Desclés, M.Dauchet, G.Jacob). Enfin une journée « statistique et linguistique » sera organisée en décembre 1982 par Th.Guilbaud et P.Lafon, avant la généralisation du format `journées d’étude’ à partir de 1983.

1982-90 : les années noires


A l’heure où l’intelligence artificielle d’une part, puis les industries de la langue d’autre part commencent à se développer et où apparaissent les premiers enseignements de linguistique informatique, l’ATALA connaît une crise assez importante.

Le nombre d’adhérents qui se maintenait, depuis les années 1960, à une centaine environ, commence à décliner en 1984. De 1985 à 1992, il n’y aura, en moyenne, qu’une soixantaine d’adhérents. Ce nombre est remonté par la suite pour atteindre 200 adhérents en 1994, puis 300 en 2001.

De 1971 à 1982, la revue TA Informations est composée et imprimée par l’entreprise `Documentation, Expansion, Productivité’ où travaille André Dewèze, rédacteur en chef de la revue. Elle est toujours diffusée par Klincksieck qui se fait continuellement tirer l’oreille pour régler les factures. En 1982-1983, la revue est composée et imprimée avec les moyens du bord et sa parution accumule peu à peu des années de retard. En 1983, c’est Pierre-Marie Lavorel, président de l’ATALA, qui assure cette tâche ; la revue est ensuite fabriquée à l’ENS de St Cloud lorsque Pierre Lafon devient président en 1984.

Le CNRS suspend sa subvention à la revue en 1986 pour la rétablir en 1987. La situation financière se rétablit peu à peu mais le retard de parution ne sera définitivement rattrapé qu’au milieu des des années 1990.

Ainsi l’association s’avère être relativement peu active lors de l’avènement des industries de la langue apparues dans la seconde moitié des années 1980 dans le sillage de certains développements technologiques, comme la micro-informatique, qui ont rendu certaines applications du traitement automatique des langues accessibles aux particuliers, et ont permis l’émergence de petites entreprises spécialisées.

Certaines conférences ont pour thème les outils informatiques ou les interfaces en langue naturelle. En 1984, on parle encore " d’applications des logiciels linguistiques pour l’industrie ", comme en témoigne la journée d’études organisée par l’ATALA en avril 1984 par Alain Marchand, Bernard Normier (directeur d’Erli fondée en 1977) et Alexandre Andreewsky. Le premier colloque sur les industries de la langue aura lieu en 1987.

Les années 1980 sont aussi marquées par l’essor de l’intelligence artificielle, notamment dans le domaine de la compréhension du langage. Ces thèmes dominent dans les journées d’étude de l’ATALA : compréhension de la parole et de l’écrit, systèmes experts, représentation des connaissances. Un peu plus tard, dans les années 1984-85, apparaît l’analyse automatique des données textuelles associée à la notion de corpus et l’interrogation de bases de données en langue naturelle.

Face aux difficultés de l’ATALA et au succès de l’intelligence artificielle émergente, la fusion des deux revues, TA Informations et Intellectica, revue de l’ARC (Association pour la Recherche Cognitive ) créée en 1981, est envisagée. Cette fusion, bien qu’encouragée en 1986 par le CNRS, a été définitivement rejetée par l’AG de l’ATALA de mars 1992, qui craignait de voir se diluer la spécificité de l’association.

Années 1990 : l’institutionalisation du TAL


Dans les années 1990, la généralisation des micro-ordinateurs et de l’internet, l’essor des entreprises et l’accroissement des professionnels dans le domaine, enfin le développement d’un enseignement spécifique dans les universités, sont autant de facteurs qui vont favoriser l’autonomisation du TAL. Parallèlement, l’ATALA va occuper un rôle de plus en plus central dans la coordination et la visibilité des différentes activités qui se réclament du domaine.

A la fin des années 1980 et au début des années 1990, on assiste à diverses initiatives au sein du milieu universitaire et de la recherche, qui témoignent du formidable essor du TAL.

En 1990, le bulletin électronique LN est créé par Jean Véronis et Pierre Zweigenbaum sous le parrainage de l’ACL et de l’ACH. Il bénéficie des soutiens financiers du GRECO-PRC Communication Homme-machine, du ministère de la Recherche et de la Technologie, et du Groupe de Représentation et Traitement des Connaissances (CNRS, Marseille), puis du GDR-PRC Communication Homme-machine (pôle langage naturel). En 1993, la liste LN-FR est créée en complément de la liste LN afin de diffuser spécifiquement les informations locales à la France. Modérée par André Molia et Pierre Zweigenbaum, elle est parrainée par l’ATALA et le PRCCommunication Homme-machine.

La seconde grande initiative concerne l’enseignement. L’université Paris 7 se montre pionnière en la matière en organisant un cursus de linguistique informatique dès 1985, sous la direction de François Charpin. En 1993, le ministère codifie un nouveau diplôme national, la licence de Sciences du Langage, mention « Traitement automatique des langues » et une maîtrise de Sciences du Langage, mention « Industries de la langue ».

Enfin, le milieu du TAL se dote d’un grand colloque annuel, inexistant jusqu’alors en France, avec la conférence TALN créée en 1994 par Philippe Blache avec le parrainage du GdR-PRC Communication homme-machine. En 1996, une session spéciale est créée au sein de TALN consacrée aux jeunes chercheurs. Celle-ci devient le colloque RECITAL.

Parallèlement, l’ATALA renforce sa revue et se dote de nouveaux moyens de diffusion.

En 1993, la revue passe du format A4 au format 15x22 plus adapté. En adoptant le nom TAL (Traitement Automatique des Langues), elle assume pleinement le nouveau domaine en train de se constituer. Elle ne se contente plus de publier les interventions des journées d’étude et se dote d’un comité de lecture. Son premier numéro (1992 33 :1 et 2) est consacré au Trentenaire de l’association.

En ce qui concerne l’évolution des journées d’étude, elle est parallèle à l’essor du TAL. Les exposés sur la formalisation en linguistique encore très présents jusqu’au milieu des années 1990, vont progressivement laisser la place aux modèles formels de grammaire plus directement implémentables en machine comme les TAGs et aux exposés plus directement orientés vers le TAL, c’est-à-dire vers l’élaboration d’outils de traitement : analyseurs syntaxiques, analyseurs probabilistes, génération, dictionnaires électroniques, annotation de corpus, traitement de l’ambiguité, traitement automatique des noms composés ou de la polysémie nominale, interface syntaxe-sémantique, interaction prosodie-syntaxe... A partir de 1997, ces exposés deviennent nettement majoritaires et se partagent les journées d’étude avec les exposés en ingénierie linguistique. Bien qu’il ne soit pas toujours facile de faire la part entre développements en TAL et en ingénierie linguistique, on peut dire que les seconds sont nettement plus orientés vers les applications industrielles : aides à l’écriture, vérificateurs de textes, recherche et extraction d’informations, résumés de textes.

En définissant le TAL au confluent de l’ingénierie linguistique, de l’intelligence artificielle et de la communication homme-machine, les acteurs du TAL signalent par là-même la tension intrinsèque au TAL, dont les frontières disciplinaires sont difficilement définissables, et qui doit concilier des objectifs parfois peu compatibles à la fois de production scientifique et de rentabilité industrielle [1].

L’ATALA : principal acteur du TAL en France


C’est à partir du milieu des années 1990, que l’ATALA va occuper un rôle central et fédérateur du TAL en France grâce notamment au dynamisme de ses responsables et en particulier de Laurence Danlos, présidente de 1995 à 2000. Le regroupement sous l’égide de l’ATALA des différentes initiatives existantes mais dispersées, l’augmentation et la diversification de ses sources de financement vont finalement aboutir en 1998-1999 à ce que l’ATALA se dote d’un statut comparable à celui de l’ACL et acquière une dimension internationale.

Plusieurs étapes peuvent être observées dans cette montée en puissance de l’ATALA, qui atteindra son apogée en 1998-99 :

En 1996, est créé le premier site WEB de l’ATALA sous la responsabilité de Pierre Zweigenbaum permettant de diffuser des informations sur les activités de l’association comme les journées d’étude et les sommaires des numéros de la revue.

Grâce au contrat TISTIL, obtenu en 1998 par Laurence Danlos auprès du MENRT, ce site WEB est remanié et étendu pour devenir en 2001 un portail technologique bilingue (anglais, français) en traitement automatique des langues et en ingénierie linguistique en France. Ont été ajoutés des annuaires, des répertoires, des outils de traitement automatique des langues, des fiches décrivant les équipes de recherche en France (30 équipes en 2001), les formations universitaires et les thèses soutenues ; une interaction en ligne permettant une mise à jour régulière des fiches.

Un second contrat, obtenu en ? ? permettra de compléter le développement de l’ATALA sur internet par le portail Technolangue ouvert en novembre 2003. Technolangue constitue le point d’entrée d’un anneau d’information électronique reliant les sites des différents partenaires (ELDA, ATALA, AFCP, APIL et AFNOR), couvrant différents secteurs des technologies de la langue en Europe, dans les pays francophones, aux Etats-Unis et au Japon.

En 2006, à l’instigation de Jean Véronis, président de l’ATALA de 2000 à 2008, le site WEB est augmenté d’un projet d’encyclopédie collaborative sur le traitement automatique des langues (AtalaPedie) sur le modèle des MediaWiki (Wikipedia).

Dans les années 1998-1999, Laurence Danlos, s’appuyant notamment sur l’augmentation notable des moyens financiers, parvient à fédérer les diverses activités du TAL autour de l’ATALA.

En 1999, les listes LN et LN-FR, qui comptent alors plus de 600 abonnés, passent sous l’égide de l’ATALA. En 2004, le conseil d’administration de L’ATALA décide de fusionner les deux listes LN et LN-FR.

Toujours en 1999, la conférence annuelle TALN passe sous l’égide de l’ATALA ainsi que le colloque des jeunes chercheurs RECITAL qui lui est associé. TALN regroupe dès lors, sur cinq jours, communications scientifiques, tables rondes, tutoriels, sessions étudiantes et ateliers thématiques.

Cette concentration, qui permet à l’ATALA de devenir l’organisateur des colloques annuels de TAL en France, et de se consistuer comme pôle fédérateur du domaine, est à l’image d’un mouvement de convergence qui se fait jour au niveau international comme le regroupement des colloques ACL et EACL en 1997, et ACL et Coling en 1998.

L’augmentation des moyens financiers permet à l’association de recruter en 2003 une personne salariée chargée de s’occuper du fichier des adhérents, de la comptabilité et de prospecter des appels d’offres. Cette collaboration prendra fin en 2005. Elle permettra également recruter un webmaster (en 2004 pour 9 mois) afin d’effectuer le remaniement en profondeur du site tel que prévu dans le cahier des charges de Technolangue.

De grands changement concernent également la revue. Depuis 1997, ses modes de financement se sont diversifiés. Outre la subvention du CNRS dont elle bénéficie depuis 1966, elle obtient à partir de 1997 une subvention du BQR de l’Université Paris 7 Denis-Diderot, et à partir de 2001 celle du BQR de l’Université Aix-Marseille.

En 2000, elle dénonce le contrat avec son diffuseur Klincksieck, toujours aussi mauvais payeur, et confie la fabrication et la diffusion de la revue à l’éditeur Hermès Sciences qui sera par la suite racheté par l’éditeur Lavoisier, en 2003. Son mode de fonctionnement devient également plus professionnel avec trois rédacteurs en chef, un comité de rédaction international, et un comité de lecture garantissant des critères d’évaluation rigoureux. Le nombre de numéros passe de deux à trois par an. Enfin, en 2006, sous la pression du CNRS qui menace de ne plus lui accorder de subvention et grâce à la diligence du président de l’ATALA, Jean Véronis, et de l’ensemble du bureau, la revue TAL devient entièrement électronique et le contrat avec l’éditeur Lavoisier est dénoncé.

Par ailleurs, l’ATALA se retrouve occuper un rôle central dans la réflexion sur l’enseignement du TAL et de la linguistique informatique. La revue TAL consacre à ce thème un numéro spécial dirigé par Anne Abeillé et Benoît Habert en 1996. En 2001, une enquête sur l’enseignement du TAL dans les universités est lancée par Jean Véronis, alors président de l’ATALA. Le groupe REPTIL est fondé la même année avec comme mission d’établir l’inventaire des formations en linguistique informatique, et de poursuivre la réflexion sur les contenus des enseignements.

Enfin, l’ATALA s’ouvre de plus en plus aux industriels en proposant de coordonner les informations sur les entreprises ayant des activités en TAL en France et en les recensant sur son site. Elle adhère à l’ASTI, créée en 1998, qui regroupe plusieurs associations dans le domaine, et participe à la fondation de l’APIL en 2001 avec laquelle elle organise une journée conjointe METIL en mars 2002. A ce titre, l’élection en juin 2008 de Frédérique Segond, directeur de recherches à XEROX, comme présidente de l’ATALA, pourrait laisser présager un net infléchissement du TAL vers les milieux industriels.

En résumé, l’expansion de l’ATALA, culminant en 1999, avec le regroupement sous son égide du colloque TALN et des listes LN et LN_FR, lui a conféré un statut comparable à celui de l’ACL, principale association du domaine, avec un fonctionnement en trois comités : le conseil d’administration de l’association, le comité de rédaction de la revue TAL et le comité permanent du colloque annuel TALN.

En concentrant les diverses manifestations du TAL en France, auparavant dispersées, l’ATALA contribue dès lors à rendre cette communauté visible, au niveau national et international, et identifiable au regard des communautés voisines comme l’Intelligence Artificielle et la Recherche d’Informations.

Conclusion


L’ATALA a toujours pris soin de prendre acte des diverses étapes de son développement et d’assurer les conditions de son historiographie. Dès 1969, TA Informations commémore les dix ans d’existence de l’association avec deux textes, l’un du président-fondateur Emile Delavenay [5], et l’autre du président en cours, Bernard Vauquois et du rédacteur en chef de la revue André Dewèze, texte qui tente de promouvoir le terme « traitement automatique des langues » [4].

La nouvelle formule de la revue TAL est inaugurée en 1992 par le numéro sur le trentenaire, comportant notamment un article d’un des fondateurs, André Lentin, sur les années pionnières de l’association [7][8].

En 1997, un numéro spécial sur l’état de l’art du TAL est co-dirigé par la présidente en cours, Laurence Danlos, et Jean Véronis, qui deviendra président en 2000. Ce numéro fait le point sur les recherches sur le traitement automatique du langage parlé, du lexique, de la syntaxe et du sens [2].

Enfin, une convention ayant pour objet le dépôt, le classement, l’archivage, la sauvegarde et la description des archives de l’ATALA par l’UMR Histoire des Théories Linguistiques est signée en 2006 entre l’association, l’Université Paris-Diderot, le CNRS et l’ENS-LSH de Lyon [6].

Index


ACH : Association for Computers in the Humanities

ACL : Association for Computational Linguistics

AFCET Association Française pour la Cybernétique Économique et Technique, renommée en Association Française des Sciences et Technologies de l’Information et des Systèmes. Association créée en 1968.

AFCP : Association Francophone de la Communication Parlée

AFLA : Association Française de Linguistique Appliquée

AFNOR : Association Française de Normalisation

AILA : Association Internationale de Linguistique Appliquée

ALPAC : Automatic Language Processing Advisory Committee, auteur du rapport Language and Machines. Computers in translation and linguistics. 1966. National Academy of Sciences, National Research Council.

AMTCL : Association for Machine Translation and Computational Linguistics.

APIL : Association des Professionnels des Industries de la Langue

ASTI : Association Française des Sciences et Technologies de l’Information

BQR : Bonus Qualité Recherche.

COLING : International Conference on Computational Linguistics

CETA : Centre d’Etude pour la Traduction Automatique

CETAG : Centre d’Etude pour la Traduction Automatique de Grenoble

CETAP : Centre d’Etude pour la Traduction Automatique de Paris

EACL : European Chapter of the Association for Computational Linguistics

ELDA : Evaluation and Language ressources Distribution Agency

EPHE : Ecole Pratique des Hautes Etudes

GRECO-PRC /CHM : Groupement de Recherches Coordonnées - Programme de Recherches Coordonnées/ Communication Homme-Machine

GRTC : Groupe de Représentation et Traitement des Connaissances

MENRT : Ministère de l’Éducation Nationale, de la Recherche et de la Technologie

METIL : Métiers des Industries de la Langue

MIT : Massachussetts Institute of Technology

OrbiTal : Réseau des jeunes chercheurs de l’ATALA.

RECITAL : Rencontre des Etudiants Chercheurs en Informatique pour le Traitement Automatique des Langues

REPTIL : Réflexion sur l’Enseignement et la Pédagogie des Techniques d’Informatique Linguistique

TAGs : Tree Adjoining Grammars

TALN : Conférence Traitement Automatique des Langues Naturelles

TISTIL : Transfert de l’information scientifique et technique en ingénierie linguistique

Bibliographie

  • [1] Cori Marcel et Léon Jacqueline .2002. « La constitution du TAL. Etude historique des dénominations et des concepts ». TAL:43-3 :21-55.
  • [2] Danlos Laurence et Véronis Jean (eds.). 1997. Etat de l’art TAL : 38-2.
  • [3] Delavenay Emile. 1992. Témoignage. D’un village savoyard au village mondial, diffusion Edisud, Aix-en-Provence.
  • [4] Dewèze André et Bernard Vauquois. 1969. « Dix ans d’ATALA : de la traduction automatique au traitement automatique des langues ». TA Informations 1969-2.57-61.
  • [5] Delavenay Emile 1969. « Quelques réflexions après dix ans... » TA Informations 1969-2.62-64.
  • [6] Lazcano Elisabeth et Jacqueline Léon. 2006. Inventaires des archives ATALA (1959-2000) CNRS, Laboratoire d’histoire des théories linguistiques UMR7597
  • [7] Lentin André. 1992. « Naissance et premiers pas de l’ATALA : quelques souvenirs et quelques réflexions ». Numéro spécial trentenaire, TAL:33-1/2 :7-24.
  • [8] Léon Jacqueline. 1992. « De la traduction automatique à la linguistique computationnelle. Contribution à une chronologie des années 1959-1965 TAL:33-1/2 :25-44.
  • [9] Léon Jacqueline. 1998. « Les débuts de la traduction automatique en France (1959-1968) : à contretemps ? », Modèles Linguistiques, tome XIX, fascicule 2 : 55-86.