Auteurs
Zweigenbaum, Pierre
Hadouche, Fadila
Grabar, Natalia
Résumé
Nous proposons une méthode pour apprendre des relations morphologiques dérivationnelles en corpus. Elle se fonde sur la cooccurrence en corpus de mots formellement proches et un filtrage complémentaire sur la forme des mots dérivés. Elle est mise en oeuvre et expérimentée sur un corpus médical. Les relations obtenues avant filtrage ont une précision moyenne de 75,6 % au 5000è rang (fenêtre de 150 mots). L’examen détaillé des dérivés adjectivaux d’un échantillon de 633 noms du champ de l’anatomie montre une bonne précision de 85-91 % et un rappel modéré de 32-34 %. Nous discutons ces résultats et proposons des pistes pour les compléter.
Mots-clés
relation morphologique
corpus
adjectif
adjectif dérivé
seuil d’association
langue
langue de spécialité
Conférence
Document