Analyse en rôles sémantiques pour le résumé automatique
Résumé
Cet article présente une approche visant à extraire les informations exprimées
dans un corpus de textes et en produire un résumé. Plusieurs variantes de
méthodes extractives de résumé de texte ont été implémentées et évaluées. Leur
principale originalité réside dans l'exploitation de structures appelées CDS (pour
Clause Description Structure) issues d'un composant d'annotation en rôles sémantiques
et non directement des phrases composant les textes. Le résumé obtenu
est un sous-ensemble des CDS issus du corpus d'origine ; ce format permettra
dans la suite la détection d'incohérences textuelles. Dans ce travail, nous retransformons
les CDS résumés en texte pour permettre la comparaison de notre
approche avec celles de la littérature. Les premiers résultats sont très encourageants
: les variantes que nous proposons obtiennent généralement de meilleurs
scores que des implémentations de méthodes de référence.