Catalogue en ligne Bibliothèque de l’Ecole Nationale Supérieure d’Informatique et d’Analyse des Systèmes.

A partir de cette page vous pouvez :

Retourner au premier écran avec les étagères virtuelles...

Catégories

Faire une suggestion Affiner la recherche

Data Lake: Des & Enjeux / Sofia LAHRICHI

Public

ISBD

Titre : Data Lake: Des & Enjeux
Type de document : projet fin études
Auteurs : Sofia LAHRICHI, Auteur
Langues : Français (fre)
Catégories : BIG DATA
Index. décimale : mast 266/19
Résumé : Les avancees technologiques rapides et le trac d'informations ont pose de nouveaux
des en matiere de capture, stockage, analyse, recherche, partage, transfert, visualisation,
interrogation, mise a jour et condentialite des informations.
Inevitablement, ces des ont necessite une nouvelle conception de l'architecture qui se
manifeste en Data Lake .
Data Lake represente un referentiel de stockage massivement evolutif et des systemes de
traitement capables d'ingerer des donnees sans compromettre la structure des donnees.
II comporte une architecture evolutive avec une haute disponibilite, un catalogage et
une indexation centralisee, un modele d'acces partage, une analyse agile et un lignage
de donnees avance.
Ce rapport qui est un resume concis de notre travail accompli dans le cadre du Projet
de Fin d'Etude, recele une presentation du data Lake, ces des, son architecture et les
formalites de sa creation. Ainsi que la creation d'une interface qui gere l'organisation
des donnees selon leurs domaines avant leurs stockages ainsi elle permet la visualisation
des metadonnees.

Data Lake: Des & Enjeux [projet fin études] / Sofia LAHRICHI, Auteur . - [s.d.].
Langues : Français (fre)
Catégories : BIG DATA
Index. décimale : mast 266/19
Résumé : Les avancees technologiques rapides et le trac d'informations ont pose de nouveaux
des en matiere de capture, stockage, analyse, recherche, partage, transfert, visualisation,
interrogation, mise a jour et condentialite des informations.
Inevitablement, ces des ont necessite une nouvelle conception de l'architecture qui se
manifeste en Data Lake .
Data Lake represente un referentiel de stockage massivement evolutif et des systemes de
traitement capables d'ingerer des donnees sans compromettre la structure des donnees.
II comporte une architecture evolutive avec une haute disponibilite, un catalogage et
une indexation centralisee, un modele d'acces partage, une analyse agile et un lignage
de donnees avance.
Ce rapport qui est un resume concis de notre travail accompli dans le cadre du Projet
de Fin d'Etude, recele une presentation du data Lake, ces des, son architecture et les
formalites de sa creation. Ainsi que la creation d'une interface qui gere l'organisation
des donnees selon leurs domaines avant leurs stockages ainsi elle permet la visualisation
des metadonnees.

Réservation
Réserver ce document

Exemplaires

Code barre Cote Support Localisation Section Disponibilité
mast 266/19 mast 266/19 SOF Texte imprimé Unité des masters Mast/19 Disponible

Detecting Spam Opinion in Online Reviews / Fatima WALID

Public

ISBD

Titre : Detecting Spam Opinion in Online Reviews
Type de document : projet fin études
Auteurs : Fatima WALID, Auteur
Langues : Français (fre)
Catégories : BIG DATA
Mots-clés : Spam Opinion, Fake Reviews Detection, Semantic Similarity, Corpus based technique, Rule based approach, Tree Based Probability approximation
Index. décimale : mast 264/19
Résumé : Spam (or fake) reviews represent a damaging and a prevalent problem since it is affecting the reliability of both decision making and data analysis of the enterprise as well as the customer’s online experience. The effective identification of spam reviews is a fundamental problem that affects the performance of virtually every application based on review corpus. It’s necessary to develop techniques that can lead business and consumers to distinguish fake from authentic reviews.
In this thesis, we explored two novel approaches that are based on semantic similarity, the first is a rule based technique, using this approach we could reach a 74% accuracy. Then we experienced with tree based probability approximation approach and we have reached 53% accuracy.

Detecting Spam Opinion in Online Reviews [projet fin études] / Fatima WALID, Auteur . - [s.d.].
Langues : Français (fre)
Catégories : BIG DATA
Mots-clés : Spam Opinion, Fake Reviews Detection, Semantic Similarity, Corpus based technique, Rule based approach, Tree Based Probability approximation
Index. décimale : mast 264/19
Résumé : Spam (or fake) reviews represent a damaging and a prevalent problem since it is affecting the reliability of both decision making and data analysis of the enterprise as well as the customer’s online experience. The effective identification of spam reviews is a fundamental problem that affects the performance of virtually every application based on review corpus. It’s necessary to develop techniques that can lead business and consumers to distinguish fake from authentic reviews.
In this thesis, we explored two novel approaches that are based on semantic similarity, the first is a rule based technique, using this approach we could reach a 74% accuracy. Then we experienced with tree based probability approximation approach and we have reached 53% accuracy.

Réservation
Réserver ce document

Exemplaires

Code barre Cote Support Localisation Section Disponibilité
mast 264/19 mast 264/19 FAT Texte imprimé Unité des masters Mast/19 Disponible

Détection, classification, étiquetage et déclenchement d’alarme en cas de détection d’un objet d’intérêt dans une vidéo / MOHAMED SELLAM

Public

ISBD

Titre : Détection, classification, étiquetage et déclenchement d’alarme en cas de détection d’un objet d’intérêt dans une vidéo
Type de document : projet fin études
Auteurs : MOHAMED SELLAM, Auteur
Langues : Français (fre)
Catégories : BIG DATA
Index. décimale : mast 244/19
Résumé : La recherche dans le domaine de la détection d’objets dans une vidéo finale ou capturée en temps réel devient un sujet de plus en plus traité. Les algorithmes conventionnels utilisent exclusivement des modèles basés sur des vecteurs de caractéristiques. Ces vecteurs restent difficiles à définir et dépendent largement du type d’objet observé. Ces méthodes donnent des résultats avec un faible taux de détection et un haut taux de fausse classification. Une approche innovante pour résoudre ce problème est d’utiliser un algorithme permettant de déterminer automatiquement les caractéristiques utiles pour classifier, étiqueter un objet et lancer une alarme en cas où un objet d’intérêt a été détecté. Dans ce rapport, nous utilisons les réseaux de neurone de convolution pour identifier les classes d’objets dans une image ,une vidéo ou une capture vidéo en temps réel puis nous ajoutons une méthode qui permet de déclencher une alarme dans le cas de la détection d’un objet spécifique. Les réseaux de neurones de convolution ont montré leur grande performance dans le domaine de la classification des objets. Testée sur des séquences vidéo soit déjà enregistré ou en temps réelles, l’approche proposée atteint une meilleure performance de classification que les méthodes conventionnelles. Ces résultats indiquent clairement que l’utilisation des réseaux de neurones de convolution pour l’identification d’objet est très prometteuse. Dans ce travail nous choisissons une combinaison de deux modèles de détection d’objet et les résultats montrent leur capacité dans ce domaine. L’ajout de la méthode qui déclenche l’alarme nous offre un défi concernant la vitesse de la lecture de la vidéo où on cherche l’objet spécifique. Ce défi peut être un sujet de recherche dans la future.

Détection, classification, étiquetage et déclenchement d’alarme en cas de détection d’un objet d’intérêt dans une vidéo [projet fin études] / MOHAMED SELLAM, Auteur . - [s.d.].
Langues : Français (fre)
Catégories : BIG DATA
Index. décimale : mast 244/19
Résumé : La recherche dans le domaine de la détection d’objets dans une vidéo finale ou capturée en temps réel devient un sujet de plus en plus traité. Les algorithmes conventionnels utilisent exclusivement des modèles basés sur des vecteurs de caractéristiques. Ces vecteurs restent difficiles à définir et dépendent largement du type d’objet observé. Ces méthodes donnent des résultats avec un faible taux de détection et un haut taux de fausse classification. Une approche innovante pour résoudre ce problème est d’utiliser un algorithme permettant de déterminer automatiquement les caractéristiques utiles pour classifier, étiqueter un objet et lancer une alarme en cas où un objet d’intérêt a été détecté. Dans ce rapport, nous utilisons les réseaux de neurone de convolution pour identifier les classes d’objets dans une image ,une vidéo ou une capture vidéo en temps réel puis nous ajoutons une méthode qui permet de déclencher une alarme dans le cas de la détection d’un objet spécifique. Les réseaux de neurones de convolution ont montré leur grande performance dans le domaine de la classification des objets. Testée sur des séquences vidéo soit déjà enregistré ou en temps réelles, l’approche proposée atteint une meilleure performance de classification que les méthodes conventionnelles. Ces résultats indiquent clairement que l’utilisation des réseaux de neurones de convolution pour l’identification d’objet est très prometteuse. Dans ce travail nous choisissons une combinaison de deux modèles de détection d’objet et les résultats montrent leur capacité dans ce domaine. L’ajout de la méthode qui déclenche l’alarme nous offre un défi concernant la vitesse de la lecture de la vidéo où on cherche l’objet spécifique. Ce défi peut être un sujet de recherche dans la future.

Réservation
Réserver ce document

Exemplaires

Code barre Cote Support Localisation Section Disponibilité
mast 244/19 mast 244/19 MOH Texte imprimé Unité des masters Mast/19 Disponible

Détection de fraude de carte de crédit / Oussama FAQUIH

Public

ISBD

Titre : Détection de fraude de carte de crédit
Type de document : projet fin études
Auteurs : Oussama FAQUIH, Auteur
Langues : Français (fre)
Catégories : BIG DATA
Index. décimale : mast 288/19
Résumé : Tout système de détection de fraude doit reposer sur des modèles. Au final, ces modèles ne sont qu’une façon de traiter des données pour en faire ressortir une information. C’est à partir de cette information que les différents systèmes et utilisateurs seront en mesure d’identifier s’il y a une fraude. Lorsque nous parlons des modèles de données et d’information, les méthodologies et outils d’intelligence d’affaires peuvent venir contribuer à la détection de fraude. C’est d’ailleurs pour ces raisons que les organismes financiers investissent de plus en plus dans l’intelligence d’affaires.
Dans ce mémoire, nous présentons un prédicteur de détection de la fraude qui se base sur la Régression logistique et qui utilise une combinaison des données en préparant les données très déséquilibrées. Notre modèle a atteint un score moyen élevée de 0,93%.

Détection de fraude de carte de crédit [projet fin études] / Oussama FAQUIH, Auteur . - [s.d.].
Langues : Français (fre)
Catégories : BIG DATA
Index. décimale : mast 288/19
Résumé : Tout système de détection de fraude doit reposer sur des modèles. Au final, ces modèles ne sont qu’une façon de traiter des données pour en faire ressortir une information. C’est à partir de cette information que les différents systèmes et utilisateurs seront en mesure d’identifier s’il y a une fraude. Lorsque nous parlons des modèles de données et d’information, les méthodologies et outils d’intelligence d’affaires peuvent venir contribuer à la détection de fraude. C’est d’ailleurs pour ces raisons que les organismes financiers investissent de plus en plus dans l’intelligence d’affaires.
Dans ce mémoire, nous présentons un prédicteur de détection de la fraude qui se base sur la Régression logistique et qui utilise une combinaison des données en préparant les données très déséquilibrées. Notre modèle a atteint un score moyen élevée de 0,93%.

Réservation
Réserver ce document

Exemplaires

Code barre Cote Support Localisation Section Disponibilité
mast 288/19 mast 288/19 OUS Texte imprimé Unité des masters Mast/19 Disponible

Développement d'un nouveau produit digital multiscreen (mobile et SmartTv) pour la télévision non linéaire / Andaloussi Ismail

Public

ISBD

Titre : Développement d'un nouveau produit digital multiscreen (mobile et SmartTv) pour la télévision non linéaire
Type de document : projet fin études
Auteurs : Andaloussi Ismail, Auteur
Langues : Français (fre)
Catégories : BIG DATA
Index. décimale : mast 231/19
Résumé : Le présent document constitue une synthèse de mon projet de fin d’études, effectué au sein de
la Société Nationale de Radiodiffusion et de Télévision, plus particulièrement au sein de la
digital lab . Ce projet a pour but la conception et le développement d’une application mobile
qui vise à faciliter l'accès à l'information en proposant un design fluide avec différents mode
d'affichage.
Durant ce projet, j’ai eu pour mission, dans un premier temps, de cerner le sujet, de comprendre
le métier du service, et de mener une étude concernant l’existant dans le but de conclure ses
limites. J’ai fixé ensuite Scrum comme méthodologie du travail, puis j’ai mené une analyse
globale des besoins permettant de réaliser le product backlog du projet suivie d’une étude
technique des différents outils. Pour chaque sprint, une étude fonctionnelle suivie de la
conception ont eu lieu avant d’aborder la réalisation et les tests.
Le projet a été élaboré en 3 sprints. Chaque sprint comprend quatre étapes :
• La première étape est une étude fonctionnelle du sprint, qui comporte
l’analyse des besoins fonctionnels et non fonctionnels.
• La deuxième étape est la conception du sprint en langage de modélisation
objet UML.
• La troisième comprend la mise en oeuvre du sprint dans une architecture
Android.
• La quatrième et la dernière étape comporte un jeu de tests.

Développement d'un nouveau produit digital multiscreen (mobile et SmartTv) pour la télévision non linéaire [projet fin études] / Andaloussi Ismail, Auteur . - [s.d.].
Langues : Français (fre)
Catégories : BIG DATA
Index. décimale : mast 231/19
Résumé : Le présent document constitue une synthèse de mon projet de fin d’études, effectué au sein de
la Société Nationale de Radiodiffusion et de Télévision, plus particulièrement au sein de la
digital lab . Ce projet a pour but la conception et le développement d’une application mobile
qui vise à faciliter l'accès à l'information en proposant un design fluide avec différents mode
d'affichage.
Durant ce projet, j’ai eu pour mission, dans un premier temps, de cerner le sujet, de comprendre
le métier du service, et de mener une étude concernant l’existant dans le but de conclure ses
limites. J’ai fixé ensuite Scrum comme méthodologie du travail, puis j’ai mené une analyse
globale des besoins permettant de réaliser le product backlog du projet suivie d’une étude
technique des différents outils. Pour chaque sprint, une étude fonctionnelle suivie de la
conception ont eu lieu avant d’aborder la réalisation et les tests.
Le projet a été élaboré en 3 sprints. Chaque sprint comprend quatre étapes :
• La première étape est une étude fonctionnelle du sprint, qui comporte
l’analyse des besoins fonctionnels et non fonctionnels.
• La deuxième étape est la conception du sprint en langage de modélisation
objet UML.
• La troisième comprend la mise en oeuvre du sprint dans une architecture
Android.
• La quatrième et la dernière étape comporte un jeu de tests.

Réservation
Réserver ce document

Exemplaires

Code barre Cote Support Localisation Section Disponibilité
mast 231/19 mast 231/19 AND Texte imprimé Unité des masters Mast/19 Disponible

Domain Specific Languages for Machine Learning in big data / Ismail Ougamane

Public

ISBD

Titre : Domain Specific Languages for Machine Learning in big data
Type de document : projet fin études
Auteurs : Ismail Ougamane, Auteur
Langues : Français (fre)
Catégories : BIG DATA
Mots-clés : DSL, Machine learning, Big data, Systematic Literature review, Meta-learning
Index. décimale : mast 240/19
Résumé : En raison des défis que Big Data impose aux algorithmes d’apprentissage automatique, ces
algorithmes doivent être adaptés et optimisés pour des applications spécifiques, une décision
importante prise par les développeurs c’est le choix du langage qui vont utiliser dans la mise
en uvre de ces algorithmes pour une application. Pour résoudre ce problème, nous présentons
une étude qui examine, résume et compare l’utilisation des DSLs et Frameworks dans
l’apprentissage machine avec le big data.
Après avoir appliqué la revue systématique de la littérature au sujet " Langage spécifique
au domaine pour l’apprentissage machine en big data ", dans la littérature, DSL peut être decrit
comme framework aussi, donc pour les résultats du SLR devrait être pour DSL et framework,
pour les DSLs nous avons découvert qu’aucune DSLs pour décrire les exigences système, et
la plupart des langages sont compilées, ainsi que les langages sont toutes graphiques et ont un
modèle descriptif, également la plupart des langages support Vector, Matrix, mais seulement 3
langages qui soutiennent des opérations graphiques. voici les résultats de notre étude, et enfin
Seulement 2 DSLs qui ont leur code source dans github.
Pour les frameworks, nous avons constaté qu’aucun framework pour résoudre les problèmes
de capture, de stockage et de visualisation de données volumineuses, ainsi que la plupart des
langages sont internes, la plupart des langages supportent les opérations Vector, Matrix, Graph,
et tous les frameworks sont open source avec une bonne communauté, avec seulement deux
frameworks qui dépassent 1000 contributeurs et commit PyTorch et TensorFlow, enfin la plupart
des langages supportent le mode parallèle et le calcul distribué / cloud.
Le dernier objectif de notre étude est de proposer une amélioration qui résout les problèmes
d’apprentissage machine suivants : manque de données et de ressources matérielles, pour cela
nous améliorons un des meta-model d’apprentissage, appelé siamois, et nous avons proposé
deux améliorations de l’architecture siamoise ; la précision moyenne des deux architectures
était meilleure que l’architecture originale.

Domain Specific Languages for Machine Learning in big data [projet fin études] / Ismail Ougamane, Auteur . - [s.d.].
Langues : Français (fre)
Catégories : BIG DATA
Mots-clés : DSL, Machine learning, Big data, Systematic Literature review, Meta-learning
Index. décimale : mast 240/19
Résumé : En raison des défis que Big Data impose aux algorithmes d’apprentissage automatique, ces
algorithmes doivent être adaptés et optimisés pour des applications spécifiques, une décision
importante prise par les développeurs c’est le choix du langage qui vont utiliser dans la mise
en uvre de ces algorithmes pour une application. Pour résoudre ce problème, nous présentons
une étude qui examine, résume et compare l’utilisation des DSLs et Frameworks dans
l’apprentissage machine avec le big data.
Après avoir appliqué la revue systématique de la littérature au sujet " Langage spécifique
au domaine pour l’apprentissage machine en big data ", dans la littérature, DSL peut être decrit
comme framework aussi, donc pour les résultats du SLR devrait être pour DSL et framework,
pour les DSLs nous avons découvert qu’aucune DSLs pour décrire les exigences système, et
la plupart des langages sont compilées, ainsi que les langages sont toutes graphiques et ont un
modèle descriptif, également la plupart des langages support Vector, Matrix, mais seulement 3
langages qui soutiennent des opérations graphiques. voici les résultats de notre étude, et enfin
Seulement 2 DSLs qui ont leur code source dans github.
Pour les frameworks, nous avons constaté qu’aucun framework pour résoudre les problèmes
de capture, de stockage et de visualisation de données volumineuses, ainsi que la plupart des
langages sont internes, la plupart des langages supportent les opérations Vector, Matrix, Graph,
et tous les frameworks sont open source avec une bonne communauté, avec seulement deux
frameworks qui dépassent 1000 contributeurs et commit PyTorch et TensorFlow, enfin la plupart
des langages supportent le mode parallèle et le calcul distribué / cloud.
Le dernier objectif de notre étude est de proposer une amélioration qui résout les problèmes
d’apprentissage machine suivants : manque de données et de ressources matérielles, pour cela
nous améliorons un des meta-model d’apprentissage, appelé siamois, et nous avons proposé
deux améliorations de l’architecture siamoise ; la précision moyenne des deux architectures
était meilleure que l’architecture originale.

Réservation
Réserver ce document

Exemplaires

Code barre Cote Support Localisation Section Disponibilité
mast 240/19 mast 240/19 ISM Texte imprimé Unité des masters Mast/19 Disponible

Electrical vehicule Consomation / Marouane Adnane

Public

ISBD

Titre : Electrical vehicule Consomation
Type de document : projet fin études
Auteurs : Marouane Adnane, Auteur
Langues : Français (fre)
Catégories : BIG DATA
Index. décimale : mast 237/19

Electrical vehicule Consomation [projet fin études] / Marouane Adnane, Auteur . - [s.d.].
Langues : Français (fre)
Catégories : BIG DATA
Index. décimale : mast 237/19

Réservation
Réserver ce document

Exemplaires

Code barre Cote Support Localisation Section Disponibilité
mast 237/19 mast 237/19 MAR Texte imprimé Unité des masters Mast/19 Disponible

EMBEDDING NETWORKS / ZINEB MOUBARIKI

Public

ISBD

Titre : EMBEDDING NETWORKS
Type de document : projet fin études
Auteurs : ZINEB MOUBARIKI, Auteur
Langues : Français (fre)
Catégories : BIG DATA
Index. décimale : mast 239/19

EMBEDDING NETWORKS [projet fin études] / ZINEB MOUBARIKI, Auteur . - [s.d.].
Langues : Français (fre)
Catégories : BIG DATA
Index. décimale : mast 239/19

Réservation
Réserver ce document

Exemplaires

Code barre Cote Support Localisation Section Disponibilité
mast 239/19 mast 239/19 ZIN Texte imprimé Unité des masters Mast/19 Disponible

Estimation du flux optique par apprentissage profond / ED-DIBOUCHE ALI

Public

ISBD

Titre : Estimation du flux optique par apprentissage profond
Type de document : projet fin études
Auteurs : ED-DIBOUCHE ALI, Auteur
Langues : Français (fre)
Catégories : BIG DATA
Mots-clés : Flux optique, Apprentissage profond, Réseau de neurones à convolution, FlowNet.
Index. décimale : mast 273/19
Résumé : Le problème de l’estimation du flux optique a suscité beaucoup d’attention dans la communauté de vision par ordinateur, il a été étudié pendant des décennies, possédant une grande importance dans le domaine de classification du mouvement humain, et de robotique. En raison de la valeur pratique associée à ce sujet, il a repris récemment l’intérêt de nombreux recherches en raison de l’émergence des caméras de profondeur, mais en dépit des progrès récents dans ce domaine, une estimation du flux optique précise reste encore une tâche difficile à accomplir.
Dans ce travail nous avons essayé de faire une étude comparative des différentes méthodes d’estimation du flux optique introduites récemment, surtout les méthodes basées sur l’apprentissage automatique.
Ce manuscrit est divisé en trois chapitres, le premier présente un état de l’art de ce sujet, à travers lequel nous présentons les travaux introduits récemment. Le deuxième introduit des notions nécessaires pour faire face au problème de l’estimation du flux optique, tel que les bases de données disponibles, et les méthodes de Deep Learning utilisées pour résoudre ce problème. Finalement, le dernier chapitre fait l’objet d’une évaluation et étude comparative des résultats obtenus.

Estimation du flux optique par apprentissage profond [projet fin études] / ED-DIBOUCHE ALI, Auteur . - [s.d.].
Langues : Français (fre)
Catégories : BIG DATA
Mots-clés : Flux optique, Apprentissage profond, Réseau de neurones à convolution, FlowNet.
Index. décimale : mast 273/19
Résumé : Le problème de l’estimation du flux optique a suscité beaucoup d’attention dans la communauté de vision par ordinateur, il a été étudié pendant des décennies, possédant une grande importance dans le domaine de classification du mouvement humain, et de robotique. En raison de la valeur pratique associée à ce sujet, il a repris récemment l’intérêt de nombreux recherches en raison de l’émergence des caméras de profondeur, mais en dépit des progrès récents dans ce domaine, une estimation du flux optique précise reste encore une tâche difficile à accomplir.
Dans ce travail nous avons essayé de faire une étude comparative des différentes méthodes d’estimation du flux optique introduites récemment, surtout les méthodes basées sur l’apprentissage automatique.
Ce manuscrit est divisé en trois chapitres, le premier présente un état de l’art de ce sujet, à travers lequel nous présentons les travaux introduits récemment. Le deuxième introduit des notions nécessaires pour faire face au problème de l’estimation du flux optique, tel que les bases de données disponibles, et les méthodes de Deep Learning utilisées pour résoudre ce problème. Finalement, le dernier chapitre fait l’objet d’une évaluation et étude comparative des résultats obtenus.

Réservation
Réserver ce document

Exemplaires

Code barre Cote Support Localisation Section Disponibilité
mast 273/19 mast 273/19 EDD Texte imprimé Unité des masters Mast/19 Disponible

Hybrid Feature Extraction in Different Color Spaces using Deep Learning for Accurate Image Classification / Fatima Ezzahra Jarmouni

Public

ISBD

Titre : Hybrid Feature Extraction in Different Color Spaces using Deep Learning for Accurate Image Classification
Type de document : projet fin études
Auteurs : Fatima Ezzahra Jarmouni, Auteur
Langues : Français (fre)
Catégories : BIG DATA
Index. décimale : mast 250/19

Hybrid Feature Extraction in Different Color Spaces using Deep Learning for Accurate Image Classification [projet fin études] / Fatima Ezzahra Jarmouni, Auteur . - [s.d.].
Langues : Français (fre)
Catégories : BIG DATA
Index. décimale : mast 250/19

Réservation
Réserver ce document

Exemplaires

Code barre Cote Support Localisation Section Disponibilité
mast 250/19 mast 250/19 FAT Texte imprimé Unité des masters Mast/19 Disponible

Machine Learning and Deep Learning for Moroccan Dialect Sentiment Analysis / El Mahdi Mercha

Public

ISBD

Titre : Machine Learning and Deep Learning for Moroccan Dialect Sentiment Analysis
Type de document : projet fin études
Auteurs : El Mahdi Mercha, Auteur
Langues : Français (fre)
Catégories : BIG DATA
Index. décimale : mast 256/19
Résumé : Sentiment analysis or opinion mining is a research area of natural language processing,
that focus on the study of people's opinions, sentiments, emotions and attitudes
about several entities such as products, services, issues, events and their attributes.
In recent years, there exist a lot of research in the eld of sentiment analysis through
exploiting messages shared in the social networks and written in English or in French
etc. However, few studies have been carried out for sentiment analysis based on Arabic
dialectal languages especially the Moroccan one.
With frequent transcriptions switching between MSA, Latin and alphanumeric transcription
by its writers, the processing of this dialect becomes even more complicated.
YouTube is commonly used in Arab countries and specically in Morocco, we are
interested, in this research, in the sentiment analysis of Moroccan user's comments
on several YouTube videos.
In this master thesis, we will explore the eld of Moroccan dialect sentiment analysis.
First, we will describe the steps pursued to construct the Moroccan Dialect Sentiment
Analysis Corpus (MDSAC). Second, we will carry out several sets of experiments to
explore the impact of the dierent (i) settings for text representation, and (ii) Machine
learning algorithms used. Two folds of studies have been conducted. The
performance of classical M.L algorithms, namely Support Vector Machines (SVM),
Naïve Bayes (NB) and Logistic regression (LR), in parralel with dierent settings
for text representation, such as stemming type, indexing and weighting schemes, has
been investigated. The second fold concerns the usage of deep learning for both text
representation and classication. Two word embedding models were built, one using
Continuous Bag of Words (CBoW), and the other using Skip-gram. The dierent
architectures of deep learning ( CNN and LSTM) using the two dierent learned
word representation were compared. For both folds, a large set of experiments was
conducted to tune the dierent hyperparameters.

Machine Learning and Deep Learning for Moroccan Dialect Sentiment Analysis [projet fin études] / El Mahdi Mercha, Auteur . - [s.d.].
Langues : Français (fre)
Catégories : BIG DATA
Index. décimale : mast 256/19
Résumé : Sentiment analysis or opinion mining is a research area of natural language processing,
that focus on the study of people's opinions, sentiments, emotions and attitudes
about several entities such as products, services, issues, events and their attributes.
In recent years, there exist a lot of research in the eld of sentiment analysis through
exploiting messages shared in the social networks and written in English or in French
etc. However, few studies have been carried out for sentiment analysis based on Arabic
dialectal languages especially the Moroccan one.
With frequent transcriptions switching between MSA, Latin and alphanumeric transcription
by its writers, the processing of this dialect becomes even more complicated.
YouTube is commonly used in Arab countries and specically in Morocco, we are
interested, in this research, in the sentiment analysis of Moroccan user's comments
on several YouTube videos.
In this master thesis, we will explore the eld of Moroccan dialect sentiment analysis.
First, we will describe the steps pursued to construct the Moroccan Dialect Sentiment
Analysis Corpus (MDSAC). Second, we will carry out several sets of experiments to
explore the impact of the dierent (i) settings for text representation, and (ii) Machine
learning algorithms used. Two folds of studies have been conducted. The
performance of classical M.L algorithms, namely Support Vector Machines (SVM),
Naïve Bayes (NB) and Logistic regression (LR), in parralel with dierent settings
for text representation, such as stemming type, indexing and weighting schemes, has
been investigated. The second fold concerns the usage of deep learning for both text
representation and classication. Two word embedding models were built, one using
Continuous Bag of Words (CBoW), and the other using Skip-gram. The dierent
architectures of deep learning ( CNN and LSTM) using the two dierent learned
word representation were compared. For both folds, a large set of experiments was
conducted to tune the dierent hyperparameters.

Réservation
Réserver ce document

Exemplaires

Code barre Cote Support Localisation Section Disponibilité
mast 256/19 mast 256/19 ELM Texte imprimé Unité des masters Mast/19 Disponible

Machine Learning in Malware Detection and Classification / Mohammed REGUIBI

Public

ISBD

Titre : Machine Learning in Malware Detection and Classification
Type de document : projet fin études
Auteurs : Mohammed REGUIBI, Auteur
Langues : Français (fre)
Catégories : BIG DATA
Index. décimale : mast 277/19
Résumé : Malware detection is an important factor in the security of computer systems. However, currently used signature-based methods cannot provide accurate detection of "Zero-day" attacks and polymorphic malwares. The classification of malware has become very important to know the basis of the behaviour of malwares and to fight back cybercriminals.
The purpose of this work is to determine the best methods of extraction, representation of characteristics, as well as classification methods to obtain the best accuracy. Specifically, k-nearest neighbors (KNN), decision trees (DT), support vector machines (SVM), classifiers Naive Bayes (NB), Random Forest (RF), and XGBoost (Extreme Gradient Boosting) are the algorithms considered in this work. The dataset used for this study consists of a set of 10,868 malware files from 9 families of different types.
This work presents the recommended methods for classifying and detecting malware based on machine learning, as well as the steps for its implementation. In addition, the study may be useful as a basis for further research in the field of malware analysis with machine learning methods.

Machine Learning in Malware Detection and Classification [projet fin études] / Mohammed REGUIBI, Auteur . - [s.d.].
Langues : Français (fre)
Catégories : BIG DATA
Index. décimale : mast 277/19
Résumé : Malware detection is an important factor in the security of computer systems. However, currently used signature-based methods cannot provide accurate detection of "Zero-day" attacks and polymorphic malwares. The classification of malware has become very important to know the basis of the behaviour of malwares and to fight back cybercriminals.
The purpose of this work is to determine the best methods of extraction, representation of characteristics, as well as classification methods to obtain the best accuracy. Specifically, k-nearest neighbors (KNN), decision trees (DT), support vector machines (SVM), classifiers Naive Bayes (NB), Random Forest (RF), and XGBoost (Extreme Gradient Boosting) are the algorithms considered in this work. The dataset used for this study consists of a set of 10,868 malware files from 9 families of different types.
This work presents the recommended methods for classifying and detecting malware based on machine learning, as well as the steps for its implementation. In addition, the study may be useful as a basis for further research in the field of malware analysis with machine learning methods.

Réservation
Réserver ce document

Exemplaires

Code barre Cote Support Localisation Section Disponibilité
mast 277/19 mast 277/19 MOH Texte imprimé Unité des masters Mast/19 Disponible

Matrice Stochastique Et Applications Au Problème De Page Rank / Benkou Soumia

Public

ISBD

Titre : Matrice Stochastique Et Applications Au Problème De Page Rank
Type de document : projet fin études
Auteurs : Benkou Soumia, Auteur
Langues : Français (fre)
Catégories : BIG DATA
Index. décimale : mast 275/19
Résumé : The stochastic matrix is a matrix that has a great importance in the computer field through its uses. Among these are the Page Rank algorithm founded by Larry Page and Sergey Brin, which Google uses to classify web pages according to their relevance and the links between them.
The Page Rank algorithm calculates a vector of positive real numbers by considering navigation as a graph whose nodes are the web pages and arcs are the links that connect to each other. The same algorithm models the navigation on the Internet by the Markovian chain which makes it possible to calculate the stationary distribution of the studied chain which presents the probability of following the links proposed by a page.
In this modest work, we will talk about matrix algebra reminders while introducing the stochastic matrix and its properties, the Page Rank and its definition, its algorithm and how to use it in different situations.
The Markovian chain models Internet browsing in the case of irreducibility and aperiodicity, which makes it possible to determine the page ranking vector as being the stationary distribution of this chain.
The probability of following or not the proposed links represents the parameter of the Page Rank algorithm which makes it numerically stable.
The first chapter is devoted to the mathematical reminder of the basic notions necessary for the study of Page Rank.
The second chapter talks about the Page Rank model and its properties.
The third chapter introduces the Page Rank model and the fourth chapter is devoted to the algorithm.
In the last chapter, we talked about two examples of Page Rank and how they work.

Matrice Stochastique Et Applications Au Problème De Page Rank [projet fin études] / Benkou Soumia, Auteur . - [s.d.].
Langues : Français (fre)
Catégories : BIG DATA
Index. décimale : mast 275/19
Résumé : The stochastic matrix is a matrix that has a great importance in the computer field through its uses. Among these are the Page Rank algorithm founded by Larry Page and Sergey Brin, which Google uses to classify web pages according to their relevance and the links between them.
The Page Rank algorithm calculates a vector of positive real numbers by considering navigation as a graph whose nodes are the web pages and arcs are the links that connect to each other. The same algorithm models the navigation on the Internet by the Markovian chain which makes it possible to calculate the stationary distribution of the studied chain which presents the probability of following the links proposed by a page.
In this modest work, we will talk about matrix algebra reminders while introducing the stochastic matrix and its properties, the Page Rank and its definition, its algorithm and how to use it in different situations.
The Markovian chain models Internet browsing in the case of irreducibility and aperiodicity, which makes it possible to determine the page ranking vector as being the stationary distribution of this chain.
The probability of following or not the proposed links represents the parameter of the Page Rank algorithm which makes it numerically stable.
The first chapter is devoted to the mathematical reminder of the basic notions necessary for the study of Page Rank.
The second chapter talks about the Page Rank model and its properties.
The third chapter introduces the Page Rank model and the fourth chapter is devoted to the algorithm.
In the last chapter, we talked about two examples of Page Rank and how they work.

Réservation
Réserver ce document

Exemplaires

Code barre Cote Support Localisation Section Disponibilité
mast 275/19 mast 275/19 BEN Texte imprimé Unité des masters Mast/19 Disponible

Les Modèles Exécutables et Machine Learning : Application au Domaine de la Robotique / ABGAR KAOUTAR

Public

ISBD

Titre : Les Modèles Exécutables et Machine Learning : Application au Domaine de la Robotique
Type de document : projet fin études
Auteurs : ABGAR KAOUTAR, Auteur
Langues : Français (fre)
Catégories : BIG DATA
Mots-clés : Domain specific language, apprentissage automatique, apprentissage
par renforcement , sémantique opérationnelles , modèle .
Index. décimale : mast 272/19
Résumé : Dès que les technologies informatiques sont capables de fournir toutes
informations qui caractérisent les comportements des robots. Ils ont donné
naissance à une nouvelle génération des techniques et approches pour bien
améliorer la performance et l’autonomie des robots et surtout les robots
humains afin de nous fournir un service approprié.
Tandis que ces dernières années ont connu aussi des progrès significatifs au
niveau de l’ingénierie dirigé par les modèles ainsi que l’utilisation des méthodes
d’apprentissages automatiques afin d’effectuer des raisonnements sur données.
Notre travail vise à fournir un aperçu sur l’utilisation de ces approches pour la
collection des données sur les robots afin de les utilisées dans des cas de
prédiction ou de classification.

Les Modèles Exécutables et Machine Learning : Application au Domaine de la Robotique [projet fin études] / ABGAR KAOUTAR, Auteur . - [s.d.].
Langues : Français (fre)
Catégories : BIG DATA
Mots-clés : Domain specific language, apprentissage automatique, apprentissage
par renforcement , sémantique opérationnelles , modèle .
Index. décimale : mast 272/19
Résumé : Dès que les technologies informatiques sont capables de fournir toutes
informations qui caractérisent les comportements des robots. Ils ont donné
naissance à une nouvelle génération des techniques et approches pour bien
améliorer la performance et l’autonomie des robots et surtout les robots
humains afin de nous fournir un service approprié.
Tandis que ces dernières années ont connu aussi des progrès significatifs au
niveau de l’ingénierie dirigé par les modèles ainsi que l’utilisation des méthodes
d’apprentissages automatiques afin d’effectuer des raisonnements sur données.
Notre travail vise à fournir un aperçu sur l’utilisation de ces approches pour la
collection des données sur les robots afin de les utilisées dans des cas de
prédiction ou de classification.

Réservation
Réserver ce document

Exemplaires

Code barre Cote Support Localisation Section Disponibilité
mast 272/19 mast 272/19 ABG Texte imprimé Unité des masters Mast/19 Disponible

Network Embedding for Classification Toward a new hybrid drug repurposing method / BACHRI Walid

Public

ISBD

Titre : Network Embedding for Classification Toward a new hybrid drug repurposing method
Type de document : projet fin études
Auteurs : BACHRI Walid, Auteur
Langues : Français (fre)
Catégories : BIG DATA
Index. décimale : mast 269/19
Résumé : The abundance and the emergence of large scale biomedical and pharmacological
data has open the doors to new opportunities for drug development,
particularly for drug repurposing. In this project, we develop a new hybrid
computational method combining heterogeneous network embedding and
machine learning classification, to predict potential drug-target interactions
which is known as drug repurposing. This method takes as input a heterogeneous
network that consists of drugs and proteins related informations,
then it focuses on learning the embedding of proteins and drugs, after that
we construct an edge feature space containing a vector representation for
each pair of drug and protein based on their own learned representations
by using some binary operators, this edge feature space is used to train
classifiers to predict the presence of an edge or its absence. This method
achieves outstanding performance compared to the state of the art methods
for computational drug repurposing. The predicted drug target interactions
by our hybrid method need to be validated experimentally in a dedicated
laboratory

Network Embedding for Classification Toward a new hybrid drug repurposing method [projet fin études] / BACHRI Walid, Auteur . - [s.d.].
Langues : Français (fre)
Catégories : BIG DATA
Index. décimale : mast 269/19
Résumé : The abundance and the emergence of large scale biomedical and pharmacological
data has open the doors to new opportunities for drug development,
particularly for drug repurposing. In this project, we develop a new hybrid
computational method combining heterogeneous network embedding and
machine learning classification, to predict potential drug-target interactions
which is known as drug repurposing. This method takes as input a heterogeneous
network that consists of drugs and proteins related informations,
then it focuses on learning the embedding of proteins and drugs, after that
we construct an edge feature space containing a vector representation for
each pair of drug and protein based on their own learned representations
by using some binary operators, this edge feature space is used to train
classifiers to predict the presence of an edge or its absence. This method
achieves outstanding performance compared to the state of the art methods
for computational drug repurposing. The predicted drug target interactions
by our hybrid method need to be validated experimentally in a dedicated
laboratory

Réservation
Réserver ce document

Exemplaires

Code barre Cote Support Localisation Section Disponibilité
mast 269/19 mast 269/19 BAC Texte imprimé Unité des masters Mast/19 Disponible

Catégories

Réservation

Exemplaires

Réservation

Exemplaires

Réservation

Exemplaires

Réservation

Exemplaires

Réservation

Exemplaires

Réservation

Exemplaires

Réservation

Exemplaires

Réservation

Exemplaires

Réservation

Exemplaires

Réservation

Exemplaires

Réservation

Exemplaires

Réservation

Exemplaires

Réservation

Exemplaires

Réservation

Exemplaires

Réservation

Exemplaires

Bibliothèque de l’Ecole Nationale Supérieure d’Informatique et d’Analyse des Systèmes

Accueil

Sélection de la langue

Se connecter

Adresse