Titre : | Réalisation d'un système de synthèse de la parole arabe à  partir du texte (PARADIS) : étude et généralisation de la mélodie. | Type de document : | thèse | Auteurs : | BENABBOU Abderrahim; BOUNABAT | Année de publication : | 2002 | Langues : | Français (fre) | Catégories : | Informatique
| Mots-clés : | Synthèse de la parole à partir du texte, Langue arabe, Di-syllabe, Technique TD-PSOLA. Modèle
mélodique, Déclinaison, Evénements mélodiques locaux, Réinitialisations, Accent mélodique, Modalité. | Index. décimale : | Doct/36 | Résumé : | . Panni les divers modes de conununication Homme-Machine, la parole reste cea:tainement le mode le plus
privilégié par l'homme. Ainsi, depuis quelques années on observe une augmentation significative duoombre
d'applications et de produits conunerciaux utilisant la synthèse de la parole, Cependant; l'applicatioaqui a eu
le plus grand intérêt de la part de la communauté scientifique est la synthèse de la parole à partir texte
(TfS). EUe est à la fois l'application pratique la plus importante des technologies de la synthèse vocale et un
terrain d'expérimentation fertile pour les recherches sur la parole et les langues en général. La fonction d'un
TIS consiste dans l'idéal des cas, à traduire automatiquement un texte écrit en un message vocal intdligible,
compréhensible et naturel. Ce genre d'application présente de toute évidenceÜne complexité fortemœttiée à
la langue utilisée pour le texte en entrée au système.
Le travail de thèse que nous présentons, s'inscrit dans le cadre de la synthèse de fa parole à partir du texte
pour la langue arabe. Nous y décrirons un TfS arabe totalement opérationnel baptisé PARADIS- (P3ola
ARAbic DI-syllâble Synthesizer). Ce système de synthèse se base sur la méthode de concaténation de di-
syllabes et sur la technique de synthèse temporelle TD-PSOLA.
La nécessité d'améliorer la qualité de synthèse de notre système PARADIS, particulièrement la sensation
de naturel et le bon confort d'écoule, a engagé notre travail sur l'étude et la génération de la mélodie. Ainsi,
nous avons suivi une démarche pragmatique à travers l'étude et l'analyse de corpus multilocuteurs dC.pbrases
isolées représentant les différentes modalités de la langue arabe. NoUs avons pli alOJS caractériser la'méIodie
par deux phénomènes principaux:
• la déclinaison mélodique dont la portée s'étend sur toute la phrase et que nous avons représenté peedeux
lignes haute et de base. Nous avons montré alors la relation étroite qui lie ce phénomène à ta modalité et
au nombre de syllabes de la phrase.
• les événements mélodiques locaux qui apparaissent sous fonnes de -proémmences sur la courbe
mélodique et qui sont généralement liés à la présence de. syllabes accentuées et à certains coostibJants
grammaticaux particuliers de la phrase.
Nous avons pu aussi entamer l'étude des réinitialisations mélodiques, phénomène adjacent à la dédiaaison.
Nous avons alors examiné l'impact des réinitialisations sur la courbe mélodique en fonction du nombre de
groupes de respiration générés et du contour mélodique final descendant ou ascendant-
Finalement, nous décrivons les différentes étapes de réalisation d~WI modèle de commande méJodique
devant être intégré dans le système PARADIS. Ce modèle, situé dans l'étage de conversion phonétique,
consiste en la formalisation des règles et des observations extraites à partir de l'étude des deux phéDomènes
principaux de la mélodie. Nous terminons alors par une évaluation du modèle mélodique et de la• qualité du
naturel de la synthèse en faisant une série de tests analytiques et perceptives sur des corpus de différents
styles. |
Réalisation d'un système de synthèse de la parole arabe à  partir du texte (PARADIS) : étude et généralisation de la mélodie. [thèse] / BENABBOU Abderrahim; BOUNABAT . - 2002. Langues : Français ( fre) Catégories : | Informatique
| Mots-clés : | Synthèse de la parole à partir du texte, Langue arabe, Di-syllabe, Technique TD-PSOLA. Modèle
mélodique, Déclinaison, Evénements mélodiques locaux, Réinitialisations, Accent mélodique, Modalité. | Index. décimale : | Doct/36 | Résumé : | . Panni les divers modes de conununication Homme-Machine, la parole reste cea:tainement le mode le plus
privilégié par l'homme. Ainsi, depuis quelques années on observe une augmentation significative duoombre
d'applications et de produits conunerciaux utilisant la synthèse de la parole, Cependant; l'applicatioaqui a eu
le plus grand intérêt de la part de la communauté scientifique est la synthèse de la parole à partir texte
(TfS). EUe est à la fois l'application pratique la plus importante des technologies de la synthèse vocale et un
terrain d'expérimentation fertile pour les recherches sur la parole et les langues en général. La fonction d'un
TIS consiste dans l'idéal des cas, à traduire automatiquement un texte écrit en un message vocal intdligible,
compréhensible et naturel. Ce genre d'application présente de toute évidenceÜne complexité fortemœttiée à
la langue utilisée pour le texte en entrée au système.
Le travail de thèse que nous présentons, s'inscrit dans le cadre de la synthèse de fa parole à partir du texte
pour la langue arabe. Nous y décrirons un TfS arabe totalement opérationnel baptisé PARADIS- (P3ola
ARAbic DI-syllâble Synthesizer). Ce système de synthèse se base sur la méthode de concaténation de di-
syllabes et sur la technique de synthèse temporelle TD-PSOLA.
La nécessité d'améliorer la qualité de synthèse de notre système PARADIS, particulièrement la sensation
de naturel et le bon confort d'écoule, a engagé notre travail sur l'étude et la génération de la mélodie. Ainsi,
nous avons suivi une démarche pragmatique à travers l'étude et l'analyse de corpus multilocuteurs dC.pbrases
isolées représentant les différentes modalités de la langue arabe. NoUs avons pli alOJS caractériser la'méIodie
par deux phénomènes principaux:
• la déclinaison mélodique dont la portée s'étend sur toute la phrase et que nous avons représenté peedeux
lignes haute et de base. Nous avons montré alors la relation étroite qui lie ce phénomène à ta modalité et
au nombre de syllabes de la phrase.
• les événements mélodiques locaux qui apparaissent sous fonnes de -proémmences sur la courbe
mélodique et qui sont généralement liés à la présence de. syllabes accentuées et à certains coostibJants
grammaticaux particuliers de la phrase.
Nous avons pu aussi entamer l'étude des réinitialisations mélodiques, phénomène adjacent à la dédiaaison.
Nous avons alors examiné l'impact des réinitialisations sur la courbe mélodique en fonction du nombre de
groupes de respiration générés et du contour mélodique final descendant ou ascendant-
Finalement, nous décrivons les différentes étapes de réalisation d~WI modèle de commande méJodique
devant être intégré dans le système PARADIS. Ce modèle, situé dans l'étage de conversion phonétique,
consiste en la formalisation des règles et des observations extraites à partir de l'étude des deux phéDomènes
principaux de la mélodie. Nous terminons alors par une évaluation du modèle mélodique et de la• qualité du
naturel de la synthèse en faisant une série de tests analytiques et perceptives sur des corpus de différents
styles. |
|