A partir de cette page vous pouvez :
Retourner au premier Ă©cran avec les Ă©tagĂšres virtuelles... |
RĂ©sultat de la recherche
1 rĂ©sultat(s) recherche sur le mot-clĂ© 'méta recherche générique, GENAUM, extraction d'information à partir du Web, gène/clone.'
Affiner la recherche Faire une suggestion
Méta recherche générique : vers une génération automatique des méta-moteurs de recherche / BEN LAHMER El Habib
Titre : Méta recherche générique : vers une génération automatique des méta-moteurs de recherche Type de document : thÚse Auteurs : BEN LAHMER El Habib, Auteur Langues : Français (fre) Catégories : Informatique Mots-clés : méta recherche générique, GENAUM, extraction d'information à partir du Web,
gĂšne/clone.Index. dĂ©cimale : Doct/49 RĂ©sumĂ© : La recherche d'information sur Internet, et plus précisément dans les sources publiques, devient un
acte quotidien indispensable pour tous les acteurs économiques et sociaux. Ainsi, il est de plus en
plus attrayant d'extraire les données de ces sources et de les rendre disponibles pour les
utilisateurs finaux ou pour les programmes et les applications. Ces données peuvent servir comme
base de plusieurs tâches, tels que le recouvrement d'informations, le contrôle d'événements
(actual ité des marchés financier), ou le commerce électronique (corn paraison des marchés et
marketing).
Cette thèse s'inscrit dans le cadre d'une contribution à l' amél iora:tion des systèmes de recherche et
d'extraction de données sur le Web. Elle a comme objectif d'apporter une solution pour la
génération automatique des méta-moteurs de recherche et de proposer un Système de Génération
Automatique de Méta-moteurs de Recherche (GENAUM).
Générer automatiquement un méta moteur de recherche signifie pour nous, d'une part, trouver des
procédés de communication standards au niveau de l'envoi des requêtes aux sources de recherche
et au niveau de la récupération et de l'interprétation des données, c'est-à-dire trouver des procédés
qui assurent et garantissent l'accès unifié à n'importe quelle source de recherche (problème de
requêtage). D'autre part, trouver des méthodes standard d'extraction et de fusion des données
jugées pertinentes, de telle sorte qu'elles soient indépendantes des sources sollicitées (problème
d'extraction).
Pour résoudre le prem rer problème nous avons défini les paramètres nécessaires assurant la
généricité dans la phase de la communication à partir du comportement des sources vis-à-vis des
besoins des utilisateurs. En effet, les paramètres de configuration de la communication sont les
données nécessaires pour déterminer la réaction de la source.
Pour résoudre le second problème nous avons proposé une nouvelle approche d'extraction de
données à partir du web: la méthode gène/clone, à travers laquelle l'utilisateur décrit les
informations qu'il souhaite extraire en donnant quelques instances exemples de celles-ci. Le
contexte structurel et le contexte textuel de chaque valeur d'instance sont alors recherchés dans les
pages résultats de la source. Et le gène sera alors construit et stocké de sorte à extraire les clones
correspondants. Ces clones contiennent l'information pertinente.
Méta recherche générique : vers une génération automatique des méta-moteurs de recherche [thÚse] / BEN LAHMER El Habib, Auteur . - [s.d.].
Langues : Français (fre)
Catégories : Informatique Mots-clés : méta recherche générique, GENAUM, extraction d'information à partir du Web,
gĂšne/clone.Index. dĂ©cimale : Doct/49 RĂ©sumĂ© : La recherche d'information sur Internet, et plus précisément dans les sources publiques, devient un
acte quotidien indispensable pour tous les acteurs économiques et sociaux. Ainsi, il est de plus en
plus attrayant d'extraire les données de ces sources et de les rendre disponibles pour les
utilisateurs finaux ou pour les programmes et les applications. Ces données peuvent servir comme
base de plusieurs tâches, tels que le recouvrement d'informations, le contrôle d'événements
(actual ité des marchés financier), ou le commerce électronique (corn paraison des marchés et
marketing).
Cette thèse s'inscrit dans le cadre d'une contribution à l' amél iora:tion des systèmes de recherche et
d'extraction de données sur le Web. Elle a comme objectif d'apporter une solution pour la
génération automatique des méta-moteurs de recherche et de proposer un Système de Génération
Automatique de Méta-moteurs de Recherche (GENAUM).
Générer automatiquement un méta moteur de recherche signifie pour nous, d'une part, trouver des
procédés de communication standards au niveau de l'envoi des requêtes aux sources de recherche
et au niveau de la récupération et de l'interprétation des données, c'est-à-dire trouver des procédés
qui assurent et garantissent l'accès unifié à n'importe quelle source de recherche (problème de
requêtage). D'autre part, trouver des méthodes standard d'extraction et de fusion des données
jugées pertinentes, de telle sorte qu'elles soient indépendantes des sources sollicitées (problème
d'extraction).
Pour résoudre le prem rer problème nous avons défini les paramètres nécessaires assurant la
généricité dans la phase de la communication à partir du comportement des sources vis-à-vis des
besoins des utilisateurs. En effet, les paramètres de configuration de la communication sont les
données nécessaires pour déterminer la réaction de la source.
Pour résoudre le second problème nous avons proposé une nouvelle approche d'extraction de
données à partir du web: la méthode gène/clone, à travers laquelle l'utilisateur décrit les
informations qu'il souhaite extraire en donnant quelques instances exemples de celles-ci. Le
contexte structurel et le contexte textuel de chaque valeur d'instance sont alors recherchés dans les
pages résultats de la source. Et le gène sera alors construit et stocké de sorte à extraire les clones
correspondants. Ces clones contiennent l'information pertinente.
RĂ©servation
RĂ©server ce document
Exemplaires
Code barre Cote Support Localisation Section DisponibilitĂ© Doct/49 Doc/49 BEN Texte imprimé unité des thèses UFR Doctorat Disponible