Apprentissage Automatique de Paraphrases pour l’Amélioration d’un Système de Questions-Réponses

Auteurs

Duclaye, Florence

Collin, Olivier

Yvon, François

Résumé

Dans cet article, nous présentons une méthodologie d’apprentissage faiblement supervisé pour l’extraction automatique de paraphrases à partir du Web. À partir d’un seule exemple de paire (prédicat, arguments), un corpus est progressivement accumulé par sondage duWeb. Les phases de sondage alternent avec des phases de filtrage, durant lesquelles les paraphrases les moins plausibles sont éliminées à l’aide d’une procédure de clustering non supervisée. Ce mécanisme d’apprentissage s’appuie sur un système de Questions-Réponses existant et les paraphrases apprises seront utilisées pour en améliorer le rappel. Nous nous concentrons ici sur le mécanisme d’apprentissage de ce système et en présentons les premiers résultats.

Mots-clés

paraphrase

information

information contextuelle

groupe verbal

patron d’extraction

extraction

extraction d’information

algorithme de clustering

Conférence

TALN - RECITAL 2003 : 10e conférence annuelle sur le Traitement Automatique des Langues Naturelles

Document

AC_0087.pdf