Lionel Fontan*, Cynthia Magnen**, Julien Tardieu**, Isabelle Ferrané*, Julien Pinquier*, Jérôme Farinas*, Pascal Gaillard** et Xavier Aumont***
*Université de Toulouse ; UT3 ; Institut de Recherche en Informatique de Toulouse - fontan, ferrane, pinquier, jfarinas@irit.fr
**Université de Toulouse ; UT2J ; OCTOGONE ; EA4156 - magnen, tardieu@univ-tlse2.fr
***Société Archean Technologies ; Montauban, France – xaumont@archean.fr
Résumé
Cet article présente une étude comparative entre mesures perceptives et mesures automatiques de l’intelligibilité de la parole sur de la parole dégradée par une simulation de la presbyacousie. L’objectif est de répondre à la question : peut-on se rapprocher d’une mesure perceptive humaine en utilisant un système de reconnaissance automatique de la parole ? Pour ce faire, un corpus de parole dégradée a été spécifiquement constitué puis utilisé pour des tests perceptifs et enfin soumis à un traitement automatique. De fortes corrélations entre les performances humaines et les scores de reconnaissance automatique sont observées.
Résumé (en anglais)
This study aims at comparing perceptive and automatic measures of speech intelligibility in the case of speech signals simulating the effects of age-related hearing loss (presbycusis). A new corpus especially designed for studying speech intelligibility and perception and the comparison of human speech recognition scores with Automatic Speech Recognition measures are presented. one of the long-term goals of this work being to provide automatic tools facilitating the tuning of hearing aids. By achieving strong correlations between human performances and ASR recognition scores, this work provides validation data for the use of an ASR system as a way to modelize speech intelligibility in the case of presbycusis.
Paru dans
Document
Rank
6