Martina Astrid Rodda*,**, Philomen Probert* et Barbara McGillivray**,***
*University of Oxford
**The Alan Turing Institute
***University of Cambridge
Résumé
Notre article démontre à la fois la création et l’évaluation d’un modèle de sémantique
distributionnelle du grec ancien. Tout d’abord nous avons développé un modèle d’espace vectoriel
où chaque mot est représenté par un vecteur qui codifie les informations qui concernent
ses contextes linguistiques. Ensuite nous avons validé différents modèles d’espace vectoriel en
testant leur output par rapport à des références obtenues à partir de trois sources: un savant
de l’Antiquité, la lexicographie moderne et la ressource WordNet. Enfin, en vue de démontrer
comment le modèle peut être appliqué à une activité de recherche, nous fournissons une étude
de cas, à petite échelle, de la variation sémantique dans les formules épiques, à savoir les unités
récurrentes qui ont une flexibilité linguistique limitée.
distributionnelle du grec ancien. Tout d’abord nous avons développé un modèle d’espace vectoriel
où chaque mot est représenté par un vecteur qui codifie les informations qui concernent
ses contextes linguistiques. Ensuite nous avons validé différents modèles d’espace vectoriel en
testant leur output par rapport à des références obtenues à partir de trois sources: un savant
de l’Antiquité, la lexicographie moderne et la ressource WordNet. Enfin, en vue de démontrer
comment le modèle peut être appliqué à une activité de recherche, nous fournissons une étude
de cas, à petite échelle, de la variation sémantique dans les formules épiques, à savoir les unités
récurrentes qui ont une flexibilité linguistique limitée.
Résumé (en anglais)
Our paper describes the creation and evaluation of a Distributional Semantics model
of ancient Greek. We developed a vector space model where every word is represented by a
vector which encodes information about its linguistic context(s). We validate different vector
space models by testing their output against benchmarks obtained from scholarship from the
ancient world, modern lexicography, and an NLP resource. Finally, to show how the model
can be applied to a research task, we provide the example of a small-scale study of semantic
variation in epic formulae, recurring units with limited linguistic flexibility.
of ancient Greek. We developed a vector space model where every word is represented by a
vector which encodes information about its linguistic context(s). We validate different vector
space models by testing their output against benchmarks obtained from scholarship from the
ancient world, modern lexicography, and an NLP resource. Finally, to show how the model
can be applied to a research task, we provide the example of a small-scale study of semantic
variation in epic formulae, recurring units with limited linguistic flexibility.
Paru dans
Document
Rank
3