Automatisation du codage des personnages et de leurs émotions dans les récits de rêves avec des modèles de langue

Gustave Cortal*,**
*Université Paris-Saclay, ENS Paris-Saclay, CNRS, LMF, 91190, Gif-sur-Yvette, France
**Université Paris-Saclay, CNRS, LISN, 91400, Orsay, France
Résumé
L’analyse quantitative des rêves repose sur l’annotation manuelle et chronophage des récits de rêves. Nous automatisons ce processus avec des modèles de langue séquence à séquence. Cet article présente la première étude sur la détection automatique de personnages et de leurs émotions dans la partie anglaise du corpus ouvert DreamBank de récits de rêves. Nos résultats montrent que les modèles de langue peuvent aborder efficacement cette tâche. Nous évaluons l’impact de la taille du modèle, de l’ordre de prédiction des personnages, et de la prise en compte des noms propres et des caractéristiques des personnages. À travers l’analyse des récits de rêves d’un vétéran de guerre, nous montrons que nos outils éclairent certains liens entre les rêves et les troubles psychiques, ce qui peut être utile dans les processus thérapeutiques. Notre modèle et ses annotations générées sont en accès libre.
Résumé (en anglais)
Analyzing dreams quantitatively depends on labor-intensive, manual annotation of dream narratives. We automate this process through a natural language sequence-to-sequence generation framework. This paper presents the first study on character and emotion detection in the english portion of the open DreamBank corpus of dream narratives. We evaluate the impact of model size, prediction order of characters, and the consideration of proper names and character traits. Our model and its generated annotations are publicly available.
Paru dans
Document
Rank
1