| | Titre : | LA META-RECHERCHE EN LANGUE ARABE UNE APPROCHE HYBRIDE POUR CALCULER LA PERTINENCE DOCUMENTAIRE |  | Type de document : | thèse |  | Auteurs : | Adil ENAANAI, Auteur |  | Année de publication : | 2014 |  | Langues : | Français (fre) |  | Catégories : | Informatique 
 |  | Mots-clĂ©s : | Recherche d’information, DĂ©sambiguĂŻsation documentaire, GENE/FILTER, Recherche collaborative, ARA, GENAUM. |  | Index. dĂ©cimale : | Doct/201 |  | RĂ©sumĂ© : | Un système de recherche d’information nécessite la conjugaison de modèles et algorithmes permettant la représentation, le stockage, la recherche et la visualisation d’informations.
 L’objectif fondamental de la recherche d’information consiste à mettre en oeuvre un
 mécanisme d’appariement entre requête utilisateur et documents d’une base afin de restituer
 l’information pertinente. L’élaboration d’un processus de recherche d’information pose alors
 des problèmes liés tant à la modélisation qu’à la localisation de l’information pertinente.
 La langue arabe est l'une des langues naturelles qui posent de sérieux problèmes et de grands
 défis dans le domaine du traitement automatique des langues naturelles (TALN). Dans ce
 travail, nous nous intéressons à la représentation sémantique des documents arabes, l'un des
 principaux axes du TALN et l'un des éléments décisifs dans la plupart des systèmes de
 recherche d'information.
 Dans le cadre de la recherche d'information en général et la méta-recherche d'information
 arabe sur internet en particulier, nous proposons une approche hybride, basée sur la
 représentation sémantiquedes documents Arabes et la désambiguïsation de la requête. Cette
 approche vise à raffiner de la pertinence au sein du système GENAUM développé
 antérieurement par notre équipe de travail.
 La désambiguïsation proposée dans ce mémoire, repose sur la pondération des variantes
 morphosémantiques d’un terme ambigu. Le contexte de la phrase, le profil utilisateur et les
 règles linguistiques constituent les trois facteurs primordiaux du raffinement sémantique. La
 méthode GENE/FILTER que nous proposons dans ce mémoire, est le résumé de tous les traitements effectués sur les termes ambigus. Elle permet de privilégier certaines variantes par rapport aux autres, et par conséquent, raffiner le résultat de l’appariement textuel par une formule de pertinence hybride.
 La représentation XML génétique des documents est une de nos propositions. Elle sert à sauvegarder le contenu désambiguïsé des pages web et de les indexer à travers l’agent ‘Web Profiler’ qui s’exécute en arrière-plan, et qui permet de distribuer les tâches lourdes. L’objectif ciblé est alors la collaboration implicite de tous les utilisateurs, afin de donner un sens positif à la popularité face à Page Rank de Google.
 
 | 
LA META-RECHERCHE EN LANGUE ARABE UNE APPROCHE HYBRIDE POUR CALCULER LA PERTINENCE DOCUMENTAIRE [thèse] / Adil ENAANAI , Auteur . - 2014.Langues  : Français (fre ) | CatĂ©gories : | Informatique 
 |  | Mots-clĂ©s : | Recherche d’information, DĂ©sambiguĂŻsation documentaire, GENE/FILTER, Recherche collaborative, ARA, GENAUM. |  | Index. dĂ©cimale : | Doct/201 |  | RĂ©sumĂ© : | Un système de recherche d’information nécessite la conjugaison de modèles et algorithmes permettant la représentation, le stockage, la recherche et la visualisation d’informations.
 L’objectif fondamental de la recherche d’information consiste à mettre en oeuvre un
 mécanisme d’appariement entre requête utilisateur et documents d’une base afin de restituer
 l’information pertinente. L’élaboration d’un processus de recherche d’information pose alors
 des problèmes liés tant à la modélisation qu’à la localisation de l’information pertinente.
 La langue arabe est l'une des langues naturelles qui posent de sérieux problèmes et de grands
 défis dans le domaine du traitement automatique des langues naturelles (TALN). Dans ce
 travail, nous nous intéressons à la représentation sémantique des documents arabes, l'un des
 principaux axes du TALN et l'un des éléments décisifs dans la plupart des systèmes de
 recherche d'information.
 Dans le cadre de la recherche d'information en général et la méta-recherche d'information
 arabe sur internet en particulier, nous proposons une approche hybride, basée sur la
 représentation sémantiquedes documents Arabes et la désambiguïsation de la requête. Cette
 approche vise à raffiner de la pertinence au sein du système GENAUM développé
 antérieurement par notre équipe de travail.
 La désambiguïsation proposée dans ce mémoire, repose sur la pondération des variantes
 morphosémantiques d’un terme ambigu. Le contexte de la phrase, le profil utilisateur et les
 règles linguistiques constituent les trois facteurs primordiaux du raffinement sémantique. La
 méthode GENE/FILTER que nous proposons dans ce mémoire, est le résumé de tous les traitements effectués sur les termes ambigus. Elle permet de privilégier certaines variantes par rapport aux autres, et par conséquent, raffiner le résultat de l’appariement textuel par une formule de pertinence hybride.
 La représentation XML génétique des documents est une de nos propositions. Elle sert à sauvegarder le contenu désambiguïsé des pages web et de les indexer à travers l’agent ‘Web Profiler’ qui s’exécute en arrière-plan, et qui permet de distribuer les tâches lourdes. L’objectif ciblé est alors la collaboration implicite de tous les utilisateurs, afin de donner un sens positif à la popularité face à Page Rank de Google.
 
 | 
 |