En 2014 eut lieu la première journée scientifique dédiée à l'éthique du TAL, la première journée ATALA Ethique et TAL. 10 ans plus tard, le monde du TAL a subi plusieurs révolutions et l'éthique n'a jamais été aussi présente, dans les médias, nos recherches, les appels des plus grandes conférences, comme dans l'administration du TAL international (comités d'éthique de conférences et d'ACL). Un accès par visio sera disponible, mais uniquement sur demande (karen.fort@loria.fr).
Nous nous proposons de faire le point sur les avancées et les défis à venir le 2 avril 2024, au LORIA (Nancy), avec vous et nos invité·e·s :
- Emily M. Bender (Professeure à l'Université de Washington, Présidente d'ACL), page web
- Steven Bird (Professeur à Charles Darwin University), page web
- Alexis Michaud (DR CNRS, LACITO)
Emily M. Bender, Meaning making with artificial interlocutors and risks of language technology
Humans make sense of language in context, bringing to bear their own understanding of the world including their model of their interlocutor's understanding of the world. In this talk, I will explore various potential risks that arise when we as humans bring this sense-making capacity to interactions with artificial interlocutors. That is, I will ask what happens in conversations where one party has no (or extremely limited) access to meaning and all of the interpretative work rests with the other, and briefly explore what this entails for the design of language technology.
Steven Bird, Must NLP be Extractive?
The existing paradigms of symbolic and sub-symbolic NLP are founded on epistemologies of 'language as lexico-grammatical code', and 'language as data'. Yet outside the ~500 institutional languages, the world's 6,500 oral languages often come with an epistemology of 'language as a situated and embodied social practice'. In these oral cultures, the usual pattern of language technologies and the associated extractive engagements would seem to be a poor fit. I report on a five year collaboration in an Australian Aboriginal community and how this gave rise to novel approaches to the design of language resources and technologies. I reflect on this experience and suggest ways that prioritising people on the ground and local matters of concern shines light on a new paradigm for NLP.
Alexis Michaud, Des insouciances de l'archivisme à une réflexivité constante : considérations éthiques en linguistique de terrain à l'ère du TAL
La présente communication se veut un essai de retour réflexif sur %le volet juridique et éthique d'un parcours : deux décennies d'enquêtes linguistiques de terrain sur des langues rares, au Yunnan (Chine), et de militantisme en faveur de l'ouverture des données de terrain (corpus multimédia de langues rares). Le cadre temporel coïncide avec deux décennies de progrès spectaculaires de l'informatique, et notamment du Traitement Automatique des Langues. Au fil des réflexions, il ressort que l'adoption conséquente de principes de Science ouverte amène à faire une place centrale aux questions éthiques et socio-politiques soulevées par la constitution, la publication électronique et l'exploitation de ressources en langues rares. Ces thèmes appellent une réflexion collective constante, à laquelle soient associé·es des spécialistes de Traitement Automatique des Langues.
Informations pratiques
Les communications peuvent concerner toutes les thématiques de l'éthique du TAL, y compris, bien entendu, l’impact environnemental du TAL, les enjeux liés aux langues peu dotées et au multilinguisme en général, le partage d'expériences venant d'autres disciplines. Les travaux portant sur d’autres langues que le français ou l’anglais sont évidemment les bienvenus.
Cette journée d'étude se veut un lieu d'échange ouvert sur ces sujets. Cet appel à communications s'adresse donc aux chercheur(e)s en traitement automatique des langues ou en linguistique, aux industriel(le)s et aux expert(e)s dans les questions éthiques. Cette journée est organisée conjointement avec les Réseau Thématiques LIFT 2 (Linguistique Informatique, Formelle et de Terrain ) et TAL (Traitement Automatique des Langues).
Les propositions de communications orales sont attendues avant le 8 mars 2024 sous la forme d’un résumé de une à trois pages (anonymisé).
Programme provisoire
-
9h - Accueil
-
9h30 : Introduction. Karën Fort
-
9h50 : Présentations (chair à venir)
-
Évaluation éthique de l’impact du numérique : une typologie pour la détermination des risques et de leurs vulnérabilités dans une perspective conséquentialiste. Jean-Yves Antoine and Anaïs Halftermeyer
-
Empreinte carbone des expériences en TAL : les défis de la reproductibilité. Clément Morand, Aurélie Névéol and Anne-Laure Ligozat
-
Harmful NLP: Towards a systemic injustice approach. Katrin Schulz and Marjolein Lanzing
-
-
11h : Pause café + posters :
-
Les biais dans les LLMs, de quoi parle-t-on, quelles pistes pour les détecter et les mitiger ? Anaïs Bekolo, Emilie Sirvent-Hien and Christèle Tarnec
-
What ChatGPT tells us about ourselves. Aaron Boussidan, Fanny Ducel, Aurélie Neveol and Karën Fort
-
Mesurer les risques de discrimination dans une tâche de détection d’entités nommées. Hugues de Mazancourt, Alice Bruguier and Flavie Nguyen
-
Towards an Ethical Compression of Large Language Models. Irina Proskurina, Guillaume Metzler and Julien Velcin
-
-
12h : Présentation invitée Emily M. Bender Meaning making with artificial interlocutors and risks of language technology
-
13h -14h15 Déjeuner
-
14h15 : Présentation invitée Steven Bird Must NLP be Extractive?
-
15h15 : Présentations (chair à venir)
-
Petits oublis, grands effets : le silençage des communauté linguistiques minorisées dans le TAL et ses conséquences. Mélanie Jouitteau and Loïc Grobol
-
Cross-Lingual Transfer of Debiasing Techniques. Manon Reusens, Philipp Borchert, Margot Mieskes, Jochen De Weerdt and Bart Baesens
-
Normaliser l’IA, une réponse au dilemme éthique des industriels de la langue. Hugues de Mazancourt and Alain Couillault
-
-
16h15 : Pause café
-
16h45 : Présentation invitée Alexis Michaud Des insouciances de l'archivisme à une réflexivité constante : considérations éthiques en linguistique de terrain à l'ère du TAL
-
18h : Fin
Actes :
https://members.loria.fr/KFort/files/fichiers_cours/ActesJEEthiqueEtTAL2024.pdf
Inscription (obligatoire pour le présentiel):
Si vous voulez nous suivre en ligne, merci de contacter karen.fort@loria.fr (ne PAS vous inscrire), si souhaitez venir sur place, il faut vous inscrire très rapidement ici : https://framaforms.org/inscription-a-la-journee-atala-ethique-et-tal-1708437028
Site de soumission :
https://easychair.org/conferences/?conf=ethiquetal24
Dates importantes :
- Soumission des résumés : 8 mars 2024
- Notification aux auteurs et autrices : 12 mars 2024
- Date de la journée : 2 avril 2024
Comité de Programme :
- Gilles Adda
- Maxime Amblard
- Jean-Yves Antoine
- Philippe Blache
- Vincent Claveau
- Caio Corro
- Miguel Couceiro
- Fanny Ducel
- Cécile Fabre
- Benoît Favre
- Karën Fort
- Anaïs Lefeuvre-Halftermeyer
- Gaël Lejeune
- Hugues de Mazancourt
- Alice Millour
- Philippe Muller
- Aurélie Névéol
LORIA
615, rue du Jardin Botanique
54600 Villers-les-Nancy
France