Modèle de Langue à base de Concepts pour la Recherche d'Information
Résumé
La majorité des modèles de langue appliqués à la recherche
d'information repose sur l'hypothèse d'indépendance des mots.
Plus précisément, ces modèles sont estimés à partir des mots simples
apparaissant dans les documents sans considérer les éventuelles relations
sémantiques et conceptuelles. Pour pallier ce problème, deux grandes
approches ont été explorées : la première intègre des dépendances d'ordre
surfacique entre les mots, et la seconde repose sur l'utilisation des ressources
sémantiques pour capturer les dépendances entre les mots. Le modèle de
langue que nous présentons dans cet article s'inscrit dans la seconde approche.
Nous proposons d'intégrer les dépendances entre les mots en représentant les
documents et les requêtes par les concepts.