Accueil du site Accueil du site Adhésion Contact Plan du site

Extraction et regroupement de relations entre entités pour l’extraction d’information non supervisée

Wei Wang*, Romaric Besançon*, Olivier Ferret*, Brigitte Grau**

* CEA, LIST, Laboratoire Vision et Ingénierie des Contenus 91191 Gif-sur-Yvette Cedex, France wei.wang@lip6.fr,romaric.besancon,olivier.ferret@cea.fr

** LIMSI, UPR-3251 CNRS-DR4, Bât. 508, BP 133, 91403 Orsay Cedex brigitte.grau@limsi.fr


Cet article se situe dans le cadre de l’extraction d’information non supervisée en domaine ouvert en se concentrant sur l’extraction et le regroupement à large échelle de relations entre entités nommées de type non défini a priori. L’étape d’extraction combine l’utilisation de critères simples mais efficaces et une procédure de filtrage à base d’apprentissage. L’étape de regroupement organise quant à elle les relations extraites pour en caractériser le type selon une stratégie multiniveau permettant de prendre en compte à la fois un volume important et des critères de regroupement élaborés. Les évaluations menées montrent que cette approche a la capacité d’extraire des relations avec une bonne précision et de les grouper selon leurs similarités sémantique et thématique.


Télécharger:
Fichier PDF
Wei Wang, Romaric Besançon, Olivier Ferret, Brigitte Grau
965 ko

TAL Volume 54 2013 . 2. Entités Nommées

Date de dernière mise à jour : 22 mai 2014, auteur : Rédacteurs en chef.