Accueil du site Accueil du site Adhésion Contact Plan du site

Une nouvelle représentation vectorielle pour la classification sémantique

Salma Jamoussi

Multimedia, InfoRmation systems and Advanced Computing Laboratory, MIRACL.
Pôle technologique de Sfax
Route de Tunis Km 10
B.P. 242
Sfax 3021, Tunisie.
jamoussi@gmail.com

L’idée que nous défendons dans cet article est qu’il est possible d’obtenir des concepts sémantiques significatifs par des méthodes de classification automatique. Pour ce faire, nous commençons par proposer des mesures permettant de quantifier les relations sémantiques entre mots. Ensuite, nous utilisons les méthodes de classification non supervisée pour construire les concepts d’une manière automatique. Nous testons alors deux méthodes de partitionnement : l’algorithme des K-means et les cartes de Kohonen. Ensuite, nous utilisons le réseau bayésien AutoClass conçu pour la classification non supervisée. Pour grouper les mots du vocabulaire en différentes classes, nous avons testé trois représentations vectorielles des mots. La première est une représentation contextuelle simple. La deuxième associe à chaque mot un vecteur de valeurs représentant sa similarité avec tous les mots du lexique. Enfin, la troisième représentation est une combinaison des deux premières.


Télécharger:
Fichier PDF
Salma Jamoussi
235.5 ko

TAL Volume 50 2009 . 3. Apprentissage automatique pour le TAL

Date de dernière mise à jour : 9 novembre 2010, auteur : Rédacteurs en chef.