Titre : | LA META-RECHERCHE EN LANGUE ARABE UNE APPROCHE HYBRIDE POUR CALCULER LA PERTINENCE DOCUMENTAIRE | Type de document : | thèse | Auteurs : | Adil ENAANAI, Auteur | Année de publication : | 2014 | Langues : | Français (fre) | Catégories : | Informatique
| Mots-clĂ©s : | Recherche d’information, DĂ©sambiguĂŻsation documentaire, GENE/FILTER, Recherche collaborative, ARA, GENAUM. | Index. dĂ©cimale : | Doct/201 | RĂ©sumĂ© : | Un système de recherche d’information nécessite la conjugaison de modèles et algorithmes
permettant la représentation, le stockage, la recherche et la visualisation d’informations.
L’objectif fondamental de la recherche d’information consiste à mettre en oeuvre un
mécanisme d’appariement entre requête utilisateur et documents d’une base afin de restituer
l’information pertinente. L’élaboration d’un processus de recherche d’information pose alors
des problèmes liés tant à la modélisation qu’à la localisation de l’information pertinente.
La langue arabe est l'une des langues naturelles qui posent de sérieux problèmes et de grands
défis dans le domaine du traitement automatique des langues naturelles (TALN). Dans ce
travail, nous nous intéressons à la représentation sémantique des documents arabes, l'un des
principaux axes du TALN et l'un des éléments décisifs dans la plupart des systèmes de
recherche d'information.
Dans le cadre de la recherche d'information en général et la méta-recherche d'information
arabe sur internet en particulier, nous proposons une approche hybride, basée sur la
représentation sémantiquedes documents Arabes et la désambiguïsation de la requête. Cette
approche vise à raffiner de la pertinence au sein du système GENAUM développé
antérieurement par notre équipe de travail.
La désambiguïsation proposée dans ce mémoire, repose sur la pondération des variantes
morphosémantiques d’un terme ambigu. Le contexte de la phrase, le profil utilisateur et les
règles linguistiques constituent les trois facteurs primordiaux du raffinement sémantique. La
méthode GENE/FILTER que nous proposons dans ce mémoire, est le résumé de tous les traitements effectués sur les termes ambigus. Elle permet de privilégier certaines variantes par rapport aux autres, et par conséquent, raffiner le résultat de l’appariement textuel par une formule de pertinence hybride.
La représentation XML génétique des documents est une de nos propositions. Elle sert à sauvegarder le contenu désambiguïsé des pages web et de les indexer à travers l’agent ‘Web Profiler’ qui s’exécute en arrière-plan, et qui permet de distribuer les tâches lourdes. L’objectif ciblé est alors la collaboration implicite de tous les utilisateurs, afin de donner un sens positif à la popularité face à Page Rank de Google.
|
LA META-RECHERCHE EN LANGUE ARABE UNE APPROCHE HYBRIDE POUR CALCULER LA PERTINENCE DOCUMENTAIRE [thèse] / Adil ENAANAI, Auteur . - 2014. Langues : Français ( fre) Catégories : | Informatique
| Mots-clĂ©s : | Recherche d’information, DĂ©sambiguĂŻsation documentaire, GENE/FILTER, Recherche collaborative, ARA, GENAUM. | Index. dĂ©cimale : | Doct/201 | RĂ©sumĂ© : | Un système de recherche d’information nécessite la conjugaison de modèles et algorithmes
permettant la représentation, le stockage, la recherche et la visualisation d’informations.
L’objectif fondamental de la recherche d’information consiste à mettre en oeuvre un
mécanisme d’appariement entre requête utilisateur et documents d’une base afin de restituer
l’information pertinente. L’élaboration d’un processus de recherche d’information pose alors
des problèmes liés tant à la modélisation qu’à la localisation de l’information pertinente.
La langue arabe est l'une des langues naturelles qui posent de sérieux problèmes et de grands
défis dans le domaine du traitement automatique des langues naturelles (TALN). Dans ce
travail, nous nous intéressons à la représentation sémantique des documents arabes, l'un des
principaux axes du TALN et l'un des éléments décisifs dans la plupart des systèmes de
recherche d'information.
Dans le cadre de la recherche d'information en général et la méta-recherche d'information
arabe sur internet en particulier, nous proposons une approche hybride, basée sur la
représentation sémantiquedes documents Arabes et la désambiguïsation de la requête. Cette
approche vise à raffiner de la pertinence au sein du système GENAUM développé
antérieurement par notre équipe de travail.
La désambiguïsation proposée dans ce mémoire, repose sur la pondération des variantes
morphosémantiques d’un terme ambigu. Le contexte de la phrase, le profil utilisateur et les
règles linguistiques constituent les trois facteurs primordiaux du raffinement sémantique. La
méthode GENE/FILTER que nous proposons dans ce mémoire, est le résumé de tous les traitements effectués sur les termes ambigus. Elle permet de privilégier certaines variantes par rapport aux autres, et par conséquent, raffiner le résultat de l’appariement textuel par une formule de pertinence hybride.
La représentation XML génétique des documents est une de nos propositions. Elle sert à sauvegarder le contenu désambiguïsé des pages web et de les indexer à travers l’agent ‘Web Profiler’ qui s’exécute en arrière-plan, et qui permet de distribuer les tâches lourdes. L’objectif ciblé est alors la collaboration implicite de tous les utilisateurs, afin de donner un sens positif à la popularité face à Page Rank de Google.
|
|