Titre : | Les approches de clustering « Application aux données textuelles» | Type de document : | projet fin études | Auteurs : | Lahbib AJALLOUDA, Auteur | Langues : | Français (fre) | Catégories : | Internet des Objets et Services Mobiles ( IOSM )
| Mots-clĂ©s : | Clustering, text mining, HiĂ©rarchique, floue, Partitionnement, Vectorisation. | Index. dĂ©cimale : | mast 204/19 | RĂ©sumĂ© : | Le clustering est un mécanisme de regroupement conçu pour diviser un ensemble de données en plusieurs sous-groupes appelés classes ou clusters, afin de faciliter l'analyse et la prédiction. Il a été exploité dans divers domaines tels que la médecine, le marketing, la segmentation d'images et le text mining, il nécessite ainsi un traitement préalable des données avant la classification. Le projet sur lequel nous allons travailler, entre dans le même cadre. Pour atteindre son objectif qui est la recherche d’une approche d’apprentissage non supervisées capable de classifier des données textuelles en arabe, nous avons choisi premièrement de faire une étude comparative entre les trois approches de clustering, hiérarchique, par partitionnement et floue afin de choisir la meilleure.
Nos résultats de comparaison montrent que les facteurs nécessaires au choix d’une approche, sont la quantité des données et les résultats attendus. Au cours de ce travail, nous nous intéressons à la classification des données textuelles en arabe en utilisant une approche combine par l’une des approches de clustering et l’approche de text mining à savoir, le prétraitement, la compression, la vectorisation et la classification non supervisée des données.
D’autre part, de nombreuses recherches s’intéressent à la classification des données textuelles arabes, mais leurs implémentations sont encore modestes. Le travail que nous avons effectué ne s'arrête donc pas à la présentation de l'approche, mais nous avons implémentés deux applications en python la première pour tester les trois approches de clustering, la seconde vise à tester l'approche proposée pour la classification non supervisée des textes en arabe.
|
Les approches de clustering « Application aux données textuelles» [projet fin études] / Lahbib AJALLOUDA, Auteur . - [s.d.]. Langues : Français ( fre) Catégories : | Internet des Objets et Services Mobiles ( IOSM )
| Mots-clĂ©s : | Clustering, text mining, HiĂ©rarchique, floue, Partitionnement, Vectorisation. | Index. dĂ©cimale : | mast 204/19 | RĂ©sumĂ© : | Le clustering est un mécanisme de regroupement conçu pour diviser un ensemble de données en plusieurs sous-groupes appelés classes ou clusters, afin de faciliter l'analyse et la prédiction. Il a été exploité dans divers domaines tels que la médecine, le marketing, la segmentation d'images et le text mining, il nécessite ainsi un traitement préalable des données avant la classification. Le projet sur lequel nous allons travailler, entre dans le même cadre. Pour atteindre son objectif qui est la recherche d’une approche d’apprentissage non supervisées capable de classifier des données textuelles en arabe, nous avons choisi premièrement de faire une étude comparative entre les trois approches de clustering, hiérarchique, par partitionnement et floue afin de choisir la meilleure.
Nos résultats de comparaison montrent que les facteurs nécessaires au choix d’une approche, sont la quantité des données et les résultats attendus. Au cours de ce travail, nous nous intéressons à la classification des données textuelles en arabe en utilisant une approche combine par l’une des approches de clustering et l’approche de text mining à savoir, le prétraitement, la compression, la vectorisation et la classification non supervisée des données.
D’autre part, de nombreuses recherches s’intéressent à la classification des données textuelles arabes, mais leurs implémentations sont encore modestes. Le travail que nous avons effectué ne s'arrête donc pas à la présentation de l'approche, mais nous avons implémentés deux applications en python la première pour tester les trois approches de clustering, la seconde vise à tester l'approche proposée pour la classification non supervisée des textes en arabe.
|
|