Accueil du site Accueil du site Adhésion Contact Plan du site

Ethique et TAL (22 novembre 2014)

Organisation : Karën Fort (STIH, Université Paris-sorbonne), Benoît Sagot (Alpage, INRIA/Paris 7).
Lieu : Paris, 22 novembre 2014.

Informations pratiques

Dates importantes

Objectifs de la journée

Le TAL est une discipline au cœur de l’éthique scientifique, à la fois en tant qu’elle fournit des outils pour assurer l’utilisation éthique des données mais également par son long historique de travaux sur des sources sensibles, ou la nécessaire implication de nombreux collaborateurs pour la création de ressources langagières volumineuses.

Concernant les outils, l’anonymisation des données, qu’elles soient orales ou écrites, est un enjeu tant industriel qu’académique, avec des contraintes de couverture parfois fortes selon les besoins applicatifs ou de recherche, la nature des ressources et des informations à anonymiser ou encore les limitations légales. D’autres outils du TAL s’inscrivent également dans des préoccupations éthiques, comme les outils de détection de plagiat ou de vérification de faits.

La diversification des travaux sur corpus a par ailleurs amené la communauté à traiter des sources de plus de plus sensibles, qu’il s’agisse de données personnelles, médicales, voire à caractère criminel.

En outre, l’avènement du Web 2.0. et avec lui le développement de la myriadisation (crowdsourcing), pose de nouvelles questions quant à la manière de considérer les intervenants dans la création de ressources langagières.

Enfin, les préoccupations concernant l’utilisation des outils de TAL ne sont pas nouvelles, mais elles deviennent de plus en plus sensibles à l’heure des Big Data et du recoupement des données auquel participe le TAL. Aux questions juridico-économiques (fouille de brevets, droits associés aux données/logiciels), s’ajoutent les enjeux militaires (surveillance des échanges) et sociaux (le « droit à l’oubli » imposé à Google).

Cette journée d’étude se veut un lieu d’échange ouvert sur ces sujets. Cet appel à communications s’adresse donc aux chercheur(e)s en traitement automatique des langues ou en linguistique, aux industriel(le)s ayant à utiliser des ressources langagières et aux expert(e)s dans les questions éthiques.

Thèmes de la journée

La journée commencera par une conférence invitée.

Les communications sollicitées concernent aussi bien des travaux de recherche que des expériences industrielles, notamment dans les domaines suivants : outils éthiques pour le TAL, ou reposant sur des techniques du TAL méthodes et bonnes pratiques éthiques en TAL TAL et aspects juridiques traitement des données sensibles recherche en TAL et principes éthiques myriadisation et éthique

Modalités de soumission

Les propositions seront à envoyer à Karën Fort (karen.fort@paris-sorbonne.fr - merci de préciser [ATALA] dans le début du titre) - au plus tard le 15 septembre 2014. Elles devront être rédigées en français pour les francophones, et pourront être rédigées en anglais pour les non-francophones. Les résumés seront publiés après la journée sur le site de l’ATALA.

Format de la soumission : résumé de 2 pages, formats suggérés (latex, Open/LibreOffice, MS Word) : JEEthics.sty, JEEthics.bst, JEEthics-libreoffice-template.ott,template_JEEthics.dot.

Comité scientifique

Voir : JE Ethique et TAL
Date de dernière mise à jour : 14 janvier 2015, auteur : root.