A partir de cette page vous pouvez :
Retourner au premier écran avec les étagères virtuelles... |
Catégories
> BIG DATA
Faire une suggestion Affiner la recherche
Data Lake: Des & Enjeux / Sofia LAHRICHI
Titre : Data Lake: Des & Enjeux Type de document : projet fin études Auteurs : Sofia LAHRICHI, Auteur Langues : Français (fre) Catégories : BIG DATA Index. décimale : mast 266/19 Résumé : Les avancees technologiques rapides et le trac d'informations ont pose de nouveaux
des en matiere de capture, stockage, analyse, recherche, partage, transfert, visualisation,
interrogation, mise a jour et condentialite des informations.
Inevitablement, ces des ont necessite une nouvelle conception de l'architecture qui se
manifeste en Data Lake .
Data Lake represente un referentiel de stockage massivement evolutif et des systemes de
traitement capables d'ingerer des donnees sans compromettre la structure des donnees.
II comporte une architecture evolutive avec une haute disponibilite, un catalogage et
une indexation centralisee, un modele d'acces partage, une analyse agile et un lignage
de donnees avance.
Ce rapport qui est un resume concis de notre travail accompli dans le cadre du Projet
de Fin d'Etude, recele une presentation du data Lake, ces des, son architecture et les
formalites de sa creation. Ainsi que la creation d'une interface qui gere l'organisation
des donnees selon leurs domaines avant leurs stockages ainsi elle permet la visualisation
des metadonnees.Data Lake: Des & Enjeux [projet fin Ă©tudes] / Sofia LAHRICHI, Auteur . - [s.d.].
Langues : Français (fre)
Catégories : BIG DATA Index. décimale : mast 266/19 Résumé : Les avancees technologiques rapides et le trac d'informations ont pose de nouveaux
des en matiere de capture, stockage, analyse, recherche, partage, transfert, visualisation,
interrogation, mise a jour et condentialite des informations.
Inevitablement, ces des ont necessite une nouvelle conception de l'architecture qui se
manifeste en Data Lake .
Data Lake represente un referentiel de stockage massivement evolutif et des systemes de
traitement capables d'ingerer des donnees sans compromettre la structure des donnees.
II comporte une architecture evolutive avec une haute disponibilite, un catalogage et
une indexation centralisee, un modele d'acces partage, une analyse agile et un lignage
de donnees avance.
Ce rapport qui est un resume concis de notre travail accompli dans le cadre du Projet
de Fin d'Etude, recele une presentation du data Lake, ces des, son architecture et les
formalites de sa creation. Ainsi que la creation d'une interface qui gere l'organisation
des donnees selon leurs domaines avant leurs stockages ainsi elle permet la visualisation
des metadonnees.RĂ©servation
RĂ©server ce document
Exemplaires
Code barre Cote Support Localisation Section DisponibilitĂ© mast 266/19 mast 266/19 SOF Texte imprimé Unité des masters Mast/19 Disponible Detecting Spam Opinion in Online Reviews / Fatima WALID
Titre : Detecting Spam Opinion in Online Reviews Type de document : projet fin Ă©tudes Auteurs : Fatima WALID, Auteur Langues : Français (fre) CatĂ©gories : BIG DATA Mots-clĂ©s : Spam Opinion, Fake Reviews Detection, Semantic Similarity, Corpus based technique, Rule based approach, Tree Based Probability approximation Index. dĂ©cimale : mast 264/19 RĂ©sumĂ© : Spam (or fake) reviews represent a damaging and a prevalent problem since it is affecting the reliability of both decision making and data analysis of the enterprise as well as the customer’s online experience. The effective identification of spam reviews is a fundamental problem that affects the performance of virtually every application based on review corpus. It’s necessary to develop techniques that can lead business and consumers to distinguish fake from authentic reviews.
In this thesis, we explored two novel approaches that are based on semantic similarity, the first is a rule based technique, using this approach we could reach a 74% accuracy. Then we experienced with tree based probability approximation approach and we have reached 53% accuracy.
Detecting Spam Opinion in Online Reviews [projet fin Ă©tudes] / Fatima WALID, Auteur . - [s.d.].
Langues : Français (fre)
CatĂ©gories : BIG DATA Mots-clĂ©s : Spam Opinion, Fake Reviews Detection, Semantic Similarity, Corpus based technique, Rule based approach, Tree Based Probability approximation Index. dĂ©cimale : mast 264/19 RĂ©sumĂ© : Spam (or fake) reviews represent a damaging and a prevalent problem since it is affecting the reliability of both decision making and data analysis of the enterprise as well as the customer’s online experience. The effective identification of spam reviews is a fundamental problem that affects the performance of virtually every application based on review corpus. It’s necessary to develop techniques that can lead business and consumers to distinguish fake from authentic reviews.
In this thesis, we explored two novel approaches that are based on semantic similarity, the first is a rule based technique, using this approach we could reach a 74% accuracy. Then we experienced with tree based probability approximation approach and we have reached 53% accuracy.
RĂ©servation
RĂ©server ce document
Exemplaires
Code barre Cote Support Localisation Section DisponibilitĂ© mast 264/19 mast 264/19 FAT Texte imprimé Unité des masters Mast/19 Disponible DĂ©tection, classification, Ă©tiquetage et dĂ©clenchement d’alarme en cas de dĂ©tection d’un objet d’intĂ©rĂŞt dans une vidĂ©o / MOHAMED SELLAM
Titre : DĂ©tection, classification, Ă©tiquetage et dĂ©clenchement d’alarme en cas de dĂ©tection d’un objet d’intĂ©rĂŞt dans une vidĂ©o Type de document : projet fin Ă©tudes Auteurs : MOHAMED SELLAM, Auteur Langues : Français (fre) CatĂ©gories : BIG DATA Index. dĂ©cimale : mast 244/19 RĂ©sumĂ© : La recherche dans le domaine de la détection d’objets dans une vidéo finale ou capturée en temps réel devient un sujet de plus en plus traité. Les algorithmes conventionnels utilisent exclusivement des modèles basés sur des vecteurs de caractéristiques. Ces vecteurs restent difficiles à définir et dépendent largement du type d’objet observé. Ces méthodes donnent des résultats avec un faible taux de détection et un haut taux de fausse classification. Une approche innovante pour résoudre ce problème est d’utiliser un algorithme permettant de déterminer automatiquement les caractéristiques utiles pour classifier, étiqueter un objet et lancer une alarme en cas où un objet d’intérêt a été détecté. Dans ce rapport, nous utilisons les réseaux de neurone de convolution pour identifier les classes d’objets dans une image ,une vidéo ou une capture vidéo en temps réel puis nous ajoutons une méthode qui permet de déclencher une alarme dans le cas de la détection d’un objet spécifique. Les réseaux de neurones de convolution ont montré leur grande performance dans le domaine de la classification des objets. Testée sur des séquences vidéo soit déjà enregistré ou en temps réelles, l’approche proposée atteint une meilleure performance de classification que les méthodes conventionnelles. Ces résultats indiquent clairement que l’utilisation des réseaux de neurones de convolution pour l’identification d’objet est très prometteuse. Dans ce travail nous choisissons une combinaison de deux modèles de détection d’objet et les résultats montrent leur capacité dans ce domaine. L’ajout de la méthode qui déclenche l’alarme nous offre un défi concernant la vitesse de la lecture de la vidéo où on cherche l’objet spécifique. Ce défi peut être un sujet de recherche dans la future. DĂ©tection, classification, Ă©tiquetage et dĂ©clenchement d’alarme en cas de dĂ©tection d’un objet d’intĂ©rĂŞt dans une vidĂ©o [projet fin Ă©tudes] / MOHAMED SELLAM, Auteur . - [s.d.].
Langues : Français (fre)
CatĂ©gories : BIG DATA Index. dĂ©cimale : mast 244/19 RĂ©sumĂ© : La recherche dans le domaine de la détection d’objets dans une vidéo finale ou capturée en temps réel devient un sujet de plus en plus traité. Les algorithmes conventionnels utilisent exclusivement des modèles basés sur des vecteurs de caractéristiques. Ces vecteurs restent difficiles à définir et dépendent largement du type d’objet observé. Ces méthodes donnent des résultats avec un faible taux de détection et un haut taux de fausse classification. Une approche innovante pour résoudre ce problème est d’utiliser un algorithme permettant de déterminer automatiquement les caractéristiques utiles pour classifier, étiqueter un objet et lancer une alarme en cas où un objet d’intérêt a été détecté. Dans ce rapport, nous utilisons les réseaux de neurone de convolution pour identifier les classes d’objets dans une image ,une vidéo ou une capture vidéo en temps réel puis nous ajoutons une méthode qui permet de déclencher une alarme dans le cas de la détection d’un objet spécifique. Les réseaux de neurones de convolution ont montré leur grande performance dans le domaine de la classification des objets. Testée sur des séquences vidéo soit déjà enregistré ou en temps réelles, l’approche proposée atteint une meilleure performance de classification que les méthodes conventionnelles. Ces résultats indiquent clairement que l’utilisation des réseaux de neurones de convolution pour l’identification d’objet est très prometteuse. Dans ce travail nous choisissons une combinaison de deux modèles de détection d’objet et les résultats montrent leur capacité dans ce domaine. L’ajout de la méthode qui déclenche l’alarme nous offre un défi concernant la vitesse de la lecture de la vidéo où on cherche l’objet spécifique. Ce défi peut être un sujet de recherche dans la future. RĂ©servation
RĂ©server ce document
Exemplaires
Code barre Cote Support Localisation Section DisponibilitĂ© mast 244/19 mast 244/19 MOH Texte imprimé Unité des masters Mast/19 Disponible DĂ©tection de fraude de carte de crĂ©dit / Oussama FAQUIH
Titre : DĂ©tection de fraude de carte de crĂ©dit Type de document : projet fin Ă©tudes Auteurs : Oussama FAQUIH, Auteur Langues : Français (fre) CatĂ©gories : BIG DATA Index. dĂ©cimale : mast 288/19 RĂ©sumĂ© : Tout système de détection de fraude doit reposer sur des modèles. Au final, ces modèles ne sont qu’une façon de traiter des données pour en faire ressortir une information. C’est à partir de cette information que les différents systèmes et utilisateurs seront en mesure d’identifier s’il y a une fraude. Lorsque nous parlons des modèles de données et d’information, les méthodologies et outils d’intelligence d’affaires peuvent venir contribuer à la détection de fraude. C’est d’ailleurs pour ces raisons que les organismes financiers investissent de plus en plus dans l’intelligence d’affaires.
Dans ce mémoire, nous présentons un prédicteur de détection de la fraude qui se base sur la Régression logistique et qui utilise une combinaison des données en préparant les données très déséquilibrées. Notre modèle a atteint un score moyen élevée de 0,93%.DĂ©tection de fraude de carte de crĂ©dit [projet fin Ă©tudes] / Oussama FAQUIH, Auteur . - [s.d.].
Langues : Français (fre)
CatĂ©gories : BIG DATA Index. dĂ©cimale : mast 288/19 RĂ©sumĂ© : Tout système de détection de fraude doit reposer sur des modèles. Au final, ces modèles ne sont qu’une façon de traiter des données pour en faire ressortir une information. C’est à partir de cette information que les différents systèmes et utilisateurs seront en mesure d’identifier s’il y a une fraude. Lorsque nous parlons des modèles de données et d’information, les méthodologies et outils d’intelligence d’affaires peuvent venir contribuer à la détection de fraude. C’est d’ailleurs pour ces raisons que les organismes financiers investissent de plus en plus dans l’intelligence d’affaires.
Dans ce mémoire, nous présentons un prédicteur de détection de la fraude qui se base sur la Régression logistique et qui utilise une combinaison des données en préparant les données très déséquilibrées. Notre modèle a atteint un score moyen élevée de 0,93%.RĂ©servation
RĂ©server ce document
Exemplaires
Code barre Cote Support Localisation Section DisponibilitĂ© mast 288/19 mast 288/19 OUS Texte imprimé Unité des masters Mast/19 Disponible DĂ©veloppement d'un nouveau produit digital multiscreen (mobile et SmartTv) pour la tĂ©lĂ©vision non linĂ©aire / Andaloussi Ismail
Titre : DĂ©veloppement d'un nouveau produit digital multiscreen (mobile et SmartTv) pour la tĂ©lĂ©vision non linĂ©aire Type de document : projet fin Ă©tudes Auteurs : Andaloussi Ismail, Auteur Langues : Français (fre) CatĂ©gories : BIG DATA Index. dĂ©cimale : mast 231/19 RĂ©sumĂ© : Le présent document constitue une synthèse de mon projet de fin d’études, effectué au sein de
la Société Nationale de Radiodiffusion et de Télévision, plus particulièrement au sein de la
digital lab . Ce projet a pour but la conception et le développement d’une application mobile
qui vise à faciliter l'accès à l'information en proposant un design fluide avec différents mode
d'affichage.
Durant ce projet, j’ai eu pour mission, dans un premier temps, de cerner le sujet, de comprendre
le métier du service, et de mener une étude concernant l’existant dans le but de conclure ses
limites. J’ai fixé ensuite Scrum comme méthodologie du travail, puis j’ai mené une analyse
globale des besoins permettant de réaliser le product backlog du projet suivie d’une étude
technique des différents outils. Pour chaque sprint, une étude fonctionnelle suivie de la
conception ont eu lieu avant d’aborder la réalisation et les tests.
Le projet a été élaboré en 3 sprints. Chaque sprint comprend quatre étapes :
• La première étape est une étude fonctionnelle du sprint, qui comporte
l’analyse des besoins fonctionnels et non fonctionnels.
• La deuxième étape est la conception du sprint en langage de modélisation
objet UML.
• La troisième comprend la mise en oeuvre du sprint dans une architecture
Android.
• La quatrième et la dernière étape comporte un jeu de tests.DĂ©veloppement d'un nouveau produit digital multiscreen (mobile et SmartTv) pour la tĂ©lĂ©vision non linĂ©aire [projet fin Ă©tudes] / Andaloussi Ismail, Auteur . - [s.d.].
Langues : Français (fre)
CatĂ©gories : BIG DATA Index. dĂ©cimale : mast 231/19 RĂ©sumĂ© : Le présent document constitue une synthèse de mon projet de fin d’études, effectué au sein de
la Société Nationale de Radiodiffusion et de Télévision, plus particulièrement au sein de la
digital lab . Ce projet a pour but la conception et le développement d’une application mobile
qui vise à faciliter l'accès à l'information en proposant un design fluide avec différents mode
d'affichage.
Durant ce projet, j’ai eu pour mission, dans un premier temps, de cerner le sujet, de comprendre
le métier du service, et de mener une étude concernant l’existant dans le but de conclure ses
limites. J’ai fixé ensuite Scrum comme méthodologie du travail, puis j’ai mené une analyse
globale des besoins permettant de réaliser le product backlog du projet suivie d’une étude
technique des différents outils. Pour chaque sprint, une étude fonctionnelle suivie de la
conception ont eu lieu avant d’aborder la réalisation et les tests.
Le projet a été élaboré en 3 sprints. Chaque sprint comprend quatre étapes :
• La première étape est une étude fonctionnelle du sprint, qui comporte
l’analyse des besoins fonctionnels et non fonctionnels.
• La deuxième étape est la conception du sprint en langage de modélisation
objet UML.
• La troisième comprend la mise en oeuvre du sprint dans une architecture
Android.
• La quatrième et la dernière étape comporte un jeu de tests.RĂ©servation
RĂ©server ce document
Exemplaires
Code barre Cote Support Localisation Section DisponibilitĂ© mast 231/19 mast 231/19 AND Texte imprimé Unité des masters Mast/19 Disponible Domain Specific Languages for Machine Learning in big data / Ismail Ougamane
Titre : Domain Specific Languages for Machine Learning in big data Type de document : projet fin Ă©tudes Auteurs : Ismail Ougamane, Auteur Langues : Français (fre) CatĂ©gories : BIG DATA Mots-clĂ©s : DSL, Machine learning, Big data, Systematic Literature review, Meta-learning Index. dĂ©cimale : mast 240/19 RĂ©sumĂ© : En raison des défis que Big Data impose aux algorithmes d’apprentissage automatique, ces
algorithmes doivent être adaptés et optimisés pour des applications spécifiques, une décision
importante prise par les développeurs c’est le choix du langage qui vont utiliser dans la mise
en uvre de ces algorithmes pour une application. Pour résoudre ce problème, nous présentons
une étude qui examine, résume et compare l’utilisation des DSLs et Frameworks dans
l’apprentissage machine avec le big data.
Après avoir appliqué la revue systématique de la littérature au sujet " Langage spécifique
au domaine pour l’apprentissage machine en big data ", dans la littérature, DSL peut être decrit
comme framework aussi, donc pour les résultats du SLR devrait être pour DSL et framework,
pour les DSLs nous avons découvert qu’aucune DSLs pour décrire les exigences système, et
la plupart des langages sont compilées, ainsi que les langages sont toutes graphiques et ont un
modèle descriptif, également la plupart des langages support Vector, Matrix, mais seulement 3
langages qui soutiennent des opérations graphiques. voici les résultats de notre étude, et enfin
Seulement 2 DSLs qui ont leur code source dans github.
Pour les frameworks, nous avons constaté qu’aucun framework pour résoudre les problèmes
de capture, de stockage et de visualisation de données volumineuses, ainsi que la plupart des
langages sont internes, la plupart des langages supportent les opérations Vector, Matrix, Graph,
et tous les frameworks sont open source avec une bonne communauté, avec seulement deux
frameworks qui dépassent 1000 contributeurs et commit PyTorch et TensorFlow, enfin la plupart
des langages supportent le mode parallèle et le calcul distribué / cloud.
Le dernier objectif de notre étude est de proposer une amélioration qui résout les problèmes
d’apprentissage machine suivants : manque de données et de ressources matérielles, pour cela
nous améliorons un des meta-model d’apprentissage, appelé siamois, et nous avons proposé
deux améliorations de l’architecture siamoise ; la précision moyenne des deux architectures
était meilleure que l’architecture originale.
Domain Specific Languages for Machine Learning in big data [projet fin Ă©tudes] / Ismail Ougamane, Auteur . - [s.d.].
Langues : Français (fre)
CatĂ©gories : BIG DATA Mots-clĂ©s : DSL, Machine learning, Big data, Systematic Literature review, Meta-learning Index. dĂ©cimale : mast 240/19 RĂ©sumĂ© : En raison des défis que Big Data impose aux algorithmes d’apprentissage automatique, ces
algorithmes doivent être adaptés et optimisés pour des applications spécifiques, une décision
importante prise par les développeurs c’est le choix du langage qui vont utiliser dans la mise
en uvre de ces algorithmes pour une application. Pour résoudre ce problème, nous présentons
une étude qui examine, résume et compare l’utilisation des DSLs et Frameworks dans
l’apprentissage machine avec le big data.
Après avoir appliqué la revue systématique de la littérature au sujet " Langage spécifique
au domaine pour l’apprentissage machine en big data ", dans la littérature, DSL peut être decrit
comme framework aussi, donc pour les résultats du SLR devrait être pour DSL et framework,
pour les DSLs nous avons découvert qu’aucune DSLs pour décrire les exigences système, et
la plupart des langages sont compilées, ainsi que les langages sont toutes graphiques et ont un
modèle descriptif, également la plupart des langages support Vector, Matrix, mais seulement 3
langages qui soutiennent des opérations graphiques. voici les résultats de notre étude, et enfin
Seulement 2 DSLs qui ont leur code source dans github.
Pour les frameworks, nous avons constaté qu’aucun framework pour résoudre les problèmes
de capture, de stockage et de visualisation de données volumineuses, ainsi que la plupart des
langages sont internes, la plupart des langages supportent les opérations Vector, Matrix, Graph,
et tous les frameworks sont open source avec une bonne communauté, avec seulement deux
frameworks qui dépassent 1000 contributeurs et commit PyTorch et TensorFlow, enfin la plupart
des langages supportent le mode parallèle et le calcul distribué / cloud.
Le dernier objectif de notre étude est de proposer une amélioration qui résout les problèmes
d’apprentissage machine suivants : manque de données et de ressources matérielles, pour cela
nous améliorons un des meta-model d’apprentissage, appelé siamois, et nous avons proposé
deux améliorations de l’architecture siamoise ; la précision moyenne des deux architectures
était meilleure que l’architecture originale.
RĂ©servation
RĂ©server ce document
Exemplaires
Code barre Cote Support Localisation Section DisponibilitĂ© mast 240/19 mast 240/19 ISM Texte imprimé Unité des masters Mast/19 Disponible Electrical vehicule Consomation / Marouane Adnane
Titre : Electrical vehicule Consomation Type de document : projet fin études Auteurs : Marouane Adnane, Auteur Langues : Français (fre) Catégories : BIG DATA Index. décimale : mast 237/19 Electrical vehicule Consomation [projet fin études] / Marouane Adnane, Auteur . - [s.d.].
Langues : Français (fre)
Catégories : BIG DATA Index. décimale : mast 237/19 Réservation
RĂ©server ce document
Exemplaires
Code barre Cote Support Localisation Section DisponibilitĂ© mast 237/19 mast 237/19 MAR Texte imprimé Unité des masters Mast/19 Disponible EMBEDDING NETWORKS / ZINEB MOUBARIKI
Titre : EMBEDDING NETWORKS Type de document : projet fin études Auteurs : ZINEB MOUBARIKI, Auteur Langues : Français (fre) Catégories : BIG DATA Index. décimale : mast 239/19 EMBEDDING NETWORKS [projet fin études] / ZINEB MOUBARIKI, Auteur . - [s.d.].
Langues : Français (fre)
Catégories : BIG DATA Index. décimale : mast 239/19 Réservation
RĂ©server ce document
Exemplaires
Code barre Cote Support Localisation Section DisponibilitĂ© mast 239/19 mast 239/19 ZIN Texte imprimé Unité des masters Mast/19 Disponible Estimation du flux optique par apprentissage profond / ED-DIBOUCHE ALI
Titre : Estimation du flux optique par apprentissage profond Type de document : projet fin Ă©tudes Auteurs : ED-DIBOUCHE ALI, Auteur Langues : Français (fre) CatĂ©gories : BIG DATA Mots-clĂ©s : Flux optique, Apprentissage profond, RĂ©seau de neurones Ă convolution, FlowNet. Index. dĂ©cimale : mast 273/19 RĂ©sumĂ© : Le problème de l’estimation du flux optique a suscité beaucoup d’attention dans la communauté de vision par ordinateur, il a été étudié pendant des décennies, possédant une grande importance dans le domaine de classification du mouvement humain, et de robotique. En raison de la valeur pratique associée à ce sujet, il a repris récemment l’intérêt de nombreux recherches en raison de l’émergence des caméras de profondeur, mais en dépit des progrès récents dans ce domaine, une estimation du flux optique précise reste encore une tâche difficile à accomplir.
Dans ce travail nous avons essayé de faire une étude comparative des différentes méthodes d’estimation du flux optique introduites récemment, surtout les méthodes basées sur l’apprentissage automatique.
Ce manuscrit est divisé en trois chapitres, le premier présente un état de l’art de ce sujet, à travers lequel nous présentons les travaux introduits récemment. Le deuxième introduit des notions nécessaires pour faire face au problème de l’estimation du flux optique, tel que les bases de données disponibles, et les méthodes de Deep Learning utilisées pour résoudre ce problème. Finalement, le dernier chapitre fait l’objet d’une évaluation et étude comparative des résultats obtenus.
Estimation du flux optique par apprentissage profond [projet fin Ă©tudes] / ED-DIBOUCHE ALI, Auteur . - [s.d.].
Langues : Français (fre)
CatĂ©gories : BIG DATA Mots-clĂ©s : Flux optique, Apprentissage profond, RĂ©seau de neurones Ă convolution, FlowNet. Index. dĂ©cimale : mast 273/19 RĂ©sumĂ© : Le problème de l’estimation du flux optique a suscité beaucoup d’attention dans la communauté de vision par ordinateur, il a été étudié pendant des décennies, possédant une grande importance dans le domaine de classification du mouvement humain, et de robotique. En raison de la valeur pratique associée à ce sujet, il a repris récemment l’intérêt de nombreux recherches en raison de l’émergence des caméras de profondeur, mais en dépit des progrès récents dans ce domaine, une estimation du flux optique précise reste encore une tâche difficile à accomplir.
Dans ce travail nous avons essayé de faire une étude comparative des différentes méthodes d’estimation du flux optique introduites récemment, surtout les méthodes basées sur l’apprentissage automatique.
Ce manuscrit est divisé en trois chapitres, le premier présente un état de l’art de ce sujet, à travers lequel nous présentons les travaux introduits récemment. Le deuxième introduit des notions nécessaires pour faire face au problème de l’estimation du flux optique, tel que les bases de données disponibles, et les méthodes de Deep Learning utilisées pour résoudre ce problème. Finalement, le dernier chapitre fait l’objet d’une évaluation et étude comparative des résultats obtenus.
RĂ©servation
RĂ©server ce document
Exemplaires
Code barre Cote Support Localisation Section DisponibilitĂ© mast 273/19 mast 273/19 EDD Texte imprimé Unité des masters Mast/19 Disponible Hybrid Feature Extraction in Different Color Spaces using Deep Learning for Accurate Image Classification / Fatima Ezzahra Jarmouni
Titre : Hybrid Feature Extraction in Different Color Spaces using Deep Learning for Accurate Image Classification Type de document : projet fin études Auteurs : Fatima Ezzahra Jarmouni, Auteur Langues : Français (fre) Catégories : BIG DATA Index. décimale : mast 250/19 Hybrid Feature Extraction in Different Color Spaces using Deep Learning for Accurate Image Classification [projet fin études] / Fatima Ezzahra Jarmouni, Auteur . - [s.d.].
Langues : Français (fre)
Catégories : BIG DATA Index. décimale : mast 250/19 Réservation
RĂ©server ce document
Exemplaires
Code barre Cote Support Localisation Section DisponibilitĂ© mast 250/19 mast 250/19 FAT Texte imprimé Unité des masters Mast/19 Disponible Machine Learning and Deep Learning for Moroccan Dialect Sentiment Analysis / El Mahdi Mercha
Titre : Machine Learning and Deep Learning for Moroccan Dialect Sentiment Analysis Type de document : projet fin études Auteurs : El Mahdi Mercha, Auteur Langues : Français (fre) Catégories : BIG DATA Index. décimale : mast 256/19 Résumé : Sentiment analysis or opinion mining is a research area of natural language processing,
that focus on the study of people's opinions, sentiments, emotions and attitudes
about several entities such as products, services, issues, events and their attributes.
In recent years, there exist a lot of research in the eld of sentiment analysis through
exploiting messages shared in the social networks and written in English or in French
etc. However, few studies have been carried out for sentiment analysis based on Arabic
dialectal languages especially the Moroccan one.
With frequent transcriptions switching between MSA, Latin and alphanumeric transcription
by its writers, the processing of this dialect becomes even more complicated.
YouTube is commonly used in Arab countries and specically in Morocco, we are
interested, in this research, in the sentiment analysis of Moroccan user's comments
on several YouTube videos.
In this master thesis, we will explore the eld of Moroccan dialect sentiment analysis.
First, we will describe the steps pursued to construct the Moroccan Dialect Sentiment
Analysis Corpus (MDSAC). Second, we will carry out several sets of experiments to
explore the impact of the dierent (i) settings for text representation, and (ii) Machine
learning algorithms used. Two folds of studies have been conducted. The
performance of classical M.L algorithms, namely Support Vector Machines (SVM),
Naïve Bayes (NB) and Logistic regression (LR), in parralel with dierent settings
for text representation, such as stemming type, indexing and weighting schemes, has
been investigated. The second fold concerns the usage of deep learning for both text
representation and classication. Two word embedding models were built, one using
Continuous Bag of Words (CBoW), and the other using Skip-gram. The dierent
architectures of deep learning ( CNN and LSTM) using the two dierent learned
word representation were compared. For both folds, a large set of experiments was
conducted to tune the dierent hyperparameters.Machine Learning and Deep Learning for Moroccan Dialect Sentiment Analysis [projet fin Ă©tudes] / El Mahdi Mercha, Auteur . - [s.d.].
Langues : Français (fre)
Catégories : BIG DATA Index. décimale : mast 256/19 Résumé : Sentiment analysis or opinion mining is a research area of natural language processing,
that focus on the study of people's opinions, sentiments, emotions and attitudes
about several entities such as products, services, issues, events and their attributes.
In recent years, there exist a lot of research in the eld of sentiment analysis through
exploiting messages shared in the social networks and written in English or in French
etc. However, few studies have been carried out for sentiment analysis based on Arabic
dialectal languages especially the Moroccan one.
With frequent transcriptions switching between MSA, Latin and alphanumeric transcription
by its writers, the processing of this dialect becomes even more complicated.
YouTube is commonly used in Arab countries and specically in Morocco, we are
interested, in this research, in the sentiment analysis of Moroccan user's comments
on several YouTube videos.
In this master thesis, we will explore the eld of Moroccan dialect sentiment analysis.
First, we will describe the steps pursued to construct the Moroccan Dialect Sentiment
Analysis Corpus (MDSAC). Second, we will carry out several sets of experiments to
explore the impact of the dierent (i) settings for text representation, and (ii) Machine
learning algorithms used. Two folds of studies have been conducted. The
performance of classical M.L algorithms, namely Support Vector Machines (SVM),
Naïve Bayes (NB) and Logistic regression (LR), in parralel with dierent settings
for text representation, such as stemming type, indexing and weighting schemes, has
been investigated. The second fold concerns the usage of deep learning for both text
representation and classication. Two word embedding models were built, one using
Continuous Bag of Words (CBoW), and the other using Skip-gram. The dierent
architectures of deep learning ( CNN and LSTM) using the two dierent learned
word representation were compared. For both folds, a large set of experiments was
conducted to tune the dierent hyperparameters.RĂ©servation
RĂ©server ce document
Exemplaires
Code barre Cote Support Localisation Section DisponibilitĂ© mast 256/19 mast 256/19 ELM Texte imprimé Unité des masters Mast/19 Disponible Machine Learning in Malware Detection and Classification / Mohammed REGUIBI
Titre : Machine Learning in Malware Detection and Classification Type de document : projet fin études Auteurs : Mohammed REGUIBI, Auteur Langues : Français (fre) Catégories : BIG DATA Index. décimale : mast 277/19 Résumé : Malware detection is an important factor in the security of computer systems. However, currently used signature-based methods cannot provide accurate detection of "Zero-day" attacks and polymorphic malwares. The classification of malware has become very important to know the basis of the behaviour of malwares and to fight back cybercriminals.
The purpose of this work is to determine the best methods of extraction, representation of characteristics, as well as classification methods to obtain the best accuracy. Specifically, k-nearest neighbors (KNN), decision trees (DT), support vector machines (SVM), classifiers Naive Bayes (NB), Random Forest (RF), and XGBoost (Extreme Gradient Boosting) are the algorithms considered in this work. The dataset used for this study consists of a set of 10,868 malware files from 9 families of different types.
This work presents the recommended methods for classifying and detecting malware based on machine learning, as well as the steps for its implementation. In addition, the study may be useful as a basis for further research in the field of malware analysis with machine learning methods.Machine Learning in Malware Detection and Classification [projet fin Ă©tudes] / Mohammed REGUIBI, Auteur . - [s.d.].
Langues : Français (fre)
Catégories : BIG DATA Index. décimale : mast 277/19 Résumé : Malware detection is an important factor in the security of computer systems. However, currently used signature-based methods cannot provide accurate detection of "Zero-day" attacks and polymorphic malwares. The classification of malware has become very important to know the basis of the behaviour of malwares and to fight back cybercriminals.
The purpose of this work is to determine the best methods of extraction, representation of characteristics, as well as classification methods to obtain the best accuracy. Specifically, k-nearest neighbors (KNN), decision trees (DT), support vector machines (SVM), classifiers Naive Bayes (NB), Random Forest (RF), and XGBoost (Extreme Gradient Boosting) are the algorithms considered in this work. The dataset used for this study consists of a set of 10,868 malware files from 9 families of different types.
This work presents the recommended methods for classifying and detecting malware based on machine learning, as well as the steps for its implementation. In addition, the study may be useful as a basis for further research in the field of malware analysis with machine learning methods.RĂ©servation
RĂ©server ce document
Exemplaires
Code barre Cote Support Localisation Section DisponibilitĂ© mast 277/19 mast 277/19 MOH Texte imprimé Unité des masters Mast/19 Disponible Matrice Stochastique Et Applications Au Problème De Page Rank / Benkou Soumia
Titre : Matrice Stochastique Et Applications Au Problème De Page Rank Type de document : projet fin études Auteurs : Benkou Soumia, Auteur Langues : Français (fre) Catégories : BIG DATA Index. décimale : mast 275/19 Résumé : The stochastic matrix is a matrix that has a great importance in the computer field through its uses. Among these are the Page Rank algorithm founded by Larry Page and Sergey Brin, which Google uses to classify web pages according to their relevance and the links between them.
The Page Rank algorithm calculates a vector of positive real numbers by considering navigation as a graph whose nodes are the web pages and arcs are the links that connect to each other. The same algorithm models the navigation on the Internet by the Markovian chain which makes it possible to calculate the stationary distribution of the studied chain which presents the probability of following the links proposed by a page.
In this modest work, we will talk about matrix algebra reminders while introducing the stochastic matrix and its properties, the Page Rank and its definition, its algorithm and how to use it in different situations.
The Markovian chain models Internet browsing in the case of irreducibility and aperiodicity, which makes it possible to determine the page ranking vector as being the stationary distribution of this chain.
The probability of following or not the proposed links represents the parameter of the Page Rank algorithm which makes it numerically stable.
The first chapter is devoted to the mathematical reminder of the basic notions necessary for the study of Page Rank.
The second chapter talks about the Page Rank model and its properties.
The third chapter introduces the Page Rank model and the fourth chapter is devoted to the algorithm.
In the last chapter, we talked about two examples of Page Rank and how they work.
Matrice Stochastique Et Applications Au Problème De Page Rank [projet fin études] / Benkou Soumia, Auteur . - [s.d.].
Langues : Français (fre)
Catégories : BIG DATA Index. décimale : mast 275/19 Résumé : The stochastic matrix is a matrix that has a great importance in the computer field through its uses. Among these are the Page Rank algorithm founded by Larry Page and Sergey Brin, which Google uses to classify web pages according to their relevance and the links between them.
The Page Rank algorithm calculates a vector of positive real numbers by considering navigation as a graph whose nodes are the web pages and arcs are the links that connect to each other. The same algorithm models the navigation on the Internet by the Markovian chain which makes it possible to calculate the stationary distribution of the studied chain which presents the probability of following the links proposed by a page.
In this modest work, we will talk about matrix algebra reminders while introducing the stochastic matrix and its properties, the Page Rank and its definition, its algorithm and how to use it in different situations.
The Markovian chain models Internet browsing in the case of irreducibility and aperiodicity, which makes it possible to determine the page ranking vector as being the stationary distribution of this chain.
The probability of following or not the proposed links represents the parameter of the Page Rank algorithm which makes it numerically stable.
The first chapter is devoted to the mathematical reminder of the basic notions necessary for the study of Page Rank.
The second chapter talks about the Page Rank model and its properties.
The third chapter introduces the Page Rank model and the fourth chapter is devoted to the algorithm.
In the last chapter, we talked about two examples of Page Rank and how they work.
RĂ©servation
RĂ©server ce document
Exemplaires
Code barre Cote Support Localisation Section DisponibilitĂ© mast 275/19 mast 275/19 BEN Texte imprimé Unité des masters Mast/19 Disponible Les Modèles ExĂ©cutables et Machine Learning : Application au Domaine de la Robotique / ABGAR KAOUTAR
Titre : Les Modèles Exécutables et Machine Learning : Application au Domaine de la Robotique Type de document : projet fin études Auteurs : ABGAR KAOUTAR, Auteur Langues : Français (fre) Catégories : BIG DATA Mots-clés : Domain specific language, apprentissage automatique, apprentissage
par renforcement , sĂ©mantique opĂ©rationnelles , modèle .Index. dĂ©cimale : mast 272/19 RĂ©sumĂ© : Dès que les technologies informatiques sont capables de fournir toutes
informations qui caractérisent les comportements des robots. Ils ont donné
naissance à une nouvelle génération des techniques et approches pour bien
améliorer la performance et l’autonomie des robots et surtout les robots
humains afin de nous fournir un service approprié.
Tandis que ces dernières années ont connu aussi des progrès significatifs au
niveau de l’ingénierie dirigé par les modèles ainsi que l’utilisation des méthodes
d’apprentissages automatiques afin d’effectuer des raisonnements sur données.
Notre travail vise à fournir un aperçu sur l’utilisation de ces approches pour la
collection des données sur les robots afin de les utilisées dans des cas de
prédiction ou de classification.
Les Modèles Exécutables et Machine Learning : Application au Domaine de la Robotique [projet fin études] / ABGAR KAOUTAR, Auteur . - [s.d.].
Langues : Français (fre)
Catégories : BIG DATA Mots-clés : Domain specific language, apprentissage automatique, apprentissage
par renforcement , sĂ©mantique opĂ©rationnelles , modèle .Index. dĂ©cimale : mast 272/19 RĂ©sumĂ© : Dès que les technologies informatiques sont capables de fournir toutes
informations qui caractérisent les comportements des robots. Ils ont donné
naissance à une nouvelle génération des techniques et approches pour bien
améliorer la performance et l’autonomie des robots et surtout les robots
humains afin de nous fournir un service approprié.
Tandis que ces dernières années ont connu aussi des progrès significatifs au
niveau de l’ingénierie dirigé par les modèles ainsi que l’utilisation des méthodes
d’apprentissages automatiques afin d’effectuer des raisonnements sur données.
Notre travail vise à fournir un aperçu sur l’utilisation de ces approches pour la
collection des données sur les robots afin de les utilisées dans des cas de
prédiction ou de classification.
RĂ©servation
RĂ©server ce document
Exemplaires
Code barre Cote Support Localisation Section DisponibilitĂ© mast 272/19 mast 272/19 ABG Texte imprimé Unité des masters Mast/19 Disponible Network Embedding for Classification Toward a new hybrid drug repurposing method / BACHRI Walid
Titre : Network Embedding for Classification Toward a new hybrid drug repurposing method Type de document : projet fin études Auteurs : BACHRI Walid, Auteur Langues : Français (fre) Catégories : BIG DATA Index. décimale : mast 269/19 Résumé : The abundance and the emergence of large scale biomedical and pharmacological
data has open the doors to new opportunities for drug development,
particularly for drug repurposing. In this project, we develop a new hybrid
computational method combining heterogeneous network embedding and
machine learning classification, to predict potential drug-target interactions
which is known as drug repurposing. This method takes as input a heterogeneous
network that consists of drugs and proteins related informations,
then it focuses on learning the embedding of proteins and drugs, after that
we construct an edge feature space containing a vector representation for
each pair of drug and protein based on their own learned representations
by using some binary operators, this edge feature space is used to train
classifiers to predict the presence of an edge or its absence. This method
achieves outstanding performance compared to the state of the art methods
for computational drug repurposing. The predicted drug target interactions
by our hybrid method need to be validated experimentally in a dedicated
laboratoryNetwork Embedding for Classification Toward a new hybrid drug repurposing method [projet fin Ă©tudes] / BACHRI Walid, Auteur . - [s.d.].
Langues : Français (fre)
Catégories : BIG DATA Index. décimale : mast 269/19 Résumé : The abundance and the emergence of large scale biomedical and pharmacological
data has open the doors to new opportunities for drug development,
particularly for drug repurposing. In this project, we develop a new hybrid
computational method combining heterogeneous network embedding and
machine learning classification, to predict potential drug-target interactions
which is known as drug repurposing. This method takes as input a heterogeneous
network that consists of drugs and proteins related informations,
then it focuses on learning the embedding of proteins and drugs, after that
we construct an edge feature space containing a vector representation for
each pair of drug and protein based on their own learned representations
by using some binary operators, this edge feature space is used to train
classifiers to predict the presence of an edge or its absence. This method
achieves outstanding performance compared to the state of the art methods
for computational drug repurposing. The predicted drug target interactions
by our hybrid method need to be validated experimentally in a dedicated
laboratoryRĂ©servation
RĂ©server ce document
Exemplaires
Code barre Cote Support Localisation Section DisponibilitĂ© mast 269/19 mast 269/19 BAC Texte imprimé Unité des masters Mast/19 Disponible