Dates importantes
- Date de la journée : 22 novembre 2014
- Date limite de soumission : 15 septembre 2014
- Date de notification aux auteurs : 15 octobre 2014
Objectifs de la journée
Le TAL est une discipline au cœur de l’éthique scientifique, à la fois en tant qu’elle fournit des outils pour assurer l’utilisation éthique des données mais également par son long historique de travaux sur des sources sensibles, ou la nécessaire implication de nombreux collaborateurs pour la création de ressources langagières volumineuses.
Concernant les outils, l’anonymisation des données, qu’elles soient orales ou écrites, est un enjeu tant industriel qu’académique, avec des contraintes de couverture parfois fortes selon les besoins applicatifs ou de recherche, la nature des ressources et des informations à anonymiser ou encore les limitations légales. D’autres outils du TAL s’inscrivent également dans des préoccupations éthiques, comme les outils de détection de plagiat ou de vérification de faits.
La diversification des travaux sur corpus a par ailleurs amené la communauté à traiter des sources de plus de plus sensibles, qu’il s’agisse de données personnelles, médicales, voire à caractère criminel.
En outre, l’avènement du Web 2.0. et avec lui le développement de la myriadisation (crowdsourcing), pose de nouvelles questions quant à la manière de considérer les intervenants dans la création de ressources langagières.
Enfin, les préoccupations concernant l’utilisation des outils de TAL ne sont pas nouvelles, mais elles deviennent de plus en plus sensibles à l’heure des Big Data et du recoupement des données auquel participe le TAL. Aux questions juridico-économiques (fouille de brevets, droits associés aux données/logiciels), s’ajoutent les enjeux militaires (surveillance des échanges) et sociaux (le « droit à l’oubli » imposé à Google).
Cette journée d’étude se veut un lieu d’échange ouvert sur ces sujets. Cet appel à communications s’adresse donc aux chercheur(e)s en traitement automatique des langues ou en linguistique, aux industriel(le)s ayant à utiliser des ressources langagières et aux expert(e)s dans les questions éthiques.
Thèmes de la journée
La journée commencera par une conférence invitée.
Les communications sollicitées concernent aussi bien des travaux de recherche que des expériences industrielles, notamment dans les domaines suivants : outils éthiques pour le TAL, ou reposant sur des techniques du TAL méthodes et bonnes pratiques éthiques en TAL TAL et aspects juridiques traitement des données sensibles recherche en TAL et principes éthiques myriadisation et éthique
Modalités de soumission
Les propositions seront à envoyer à Karën Fort (karen.fort@paris-sorbonne.fr - merci de préciser [ATALA] dans le début du titre) - au plus tard le 15 septembre 2014. Elles devront être rédigées en français pour les francophones, et pourront être rédigées en anglais pour les non-francophones. Les résumés seront publiés après la journée sur le site de l’ATALA.
Format de la soumission : résumé de 2 pages, formats suggérés (latex, Open/LibreOffice, MS Word) : JEEthics.sty, JEEthics.bst, JEEthics-libreoffice-template.ott,template_JEEthics.dot.
Comité scientifique
- Olivier Baude, LLL, Université d’Orléans
- Kevin B. Cohen, Biomedical Text Mining Group, University of Colorado School of Medicine
- Alain Couillault, L3i, Université de La Rochelle / Aproged
- Cécile Fabre, CLLE-ERSS, Université de Toulouse II
- Cédrick Fairon, CENTAL, Université catholique de Louvain
- Karën Fort, STIH, Université Paris-Sorbonne
- Cyril Grouin, LIMSI CNRS
- Joseph Mariani, IMMI / LIMSI CNRS
- Adeline Nazarenko, LIPN, Université Paris-Nord
- Benoît Sagot, Alpage, INRIA / Paris 7
- Isabelle Tellier, Université Sorbonne Nouvelle
Voir : JE Ethique et TAL
Sorbonne
Paris
France