Optimisation D Un Schema De Codage De La Parole A Tres Bas Debit Par Indexation D Unites De Taille Variable

Download Optimisation D Un Schema De Codage De La Parole A Tres Bas Debit Par Indexation D Unites De Taille Variable PDF/ePub or read online books in Mobi eBooks. Click Download or Read Online button to get Optimisation D Un Schema De Codage De La Parole A Tres Bas Debit Par Indexation D Unites De Taille Variable book now. This website allows unlimited access to, at the time of writing, more than 1.5 million titles, including hundreds of thousands of titles in various foreign languages.
Optimisation d'un schéma de codage de la parole à très bas débit, par indexation d'unités de taille variable

Cette thèse a pour but d'étudier un schéma de codage à très bas débit, de l’ordre de 500 bit/s, s’appuyant sur des techniques de reconnaissance et de synthèse vocale. Elle s'inscrit dans la continuité des travaux menés à la fois au cours du projet RNRT SYMPATEX et de la thèse de Cernocky. L’encodeur effectue une reconnaissance d’unités élémentaires de parole à l’aide de modèles de Markov cachés. Le décodeur intègre une approche de synthèse par concaténation d'unités acoustiques. Ce schéma exploite un grand corpus de parole stocké dans le système et organisé en une base de synthèse. L’encodeur y recherche les unités qui représentent au mieux la parole, puis transmet leurs indices ainsi que des paramètres prosodiques. Le décodeur y extrait les unités à concaténer pour restituer la parole. Les problèmes traités au cours de cette thèse portent sur l'amélioration de la qualité générale du schéma de codage. Une approche de sélection dynamique des unités est proposée à cet effet. De plus, le fonctionnement du schéma a été étendu à des conditions réalistes d'utilisation. Ainsi, le schéma est étudié dans plusieurs environnements bruyants et une méthode d’adaptation au bruit est proposée. L’extension au mode indépendant du locuteur est réalisée par un apprentissage conjoint sur un grand nombre de locuteurs, associé à une classification hiérarchique des locuteurs permettant de constituer un jeu de bases de synthèse proche du locuteur à coder. Enfin, la complexité du schéma est analysée et une méthode de compression de la base de synthèse est proposée
TRAITEMENT DE LA PAROLE S'APPUYANT SUR DES UNITES SEGMENTALES DETERMINEES AUTOMATIQUEMENT

LES SYSTEMES COURANTS DE TRAITEMENT AUTOMATIQUE DE LA PAROLE (TAP) - LA RECONNAISSANCE, LA SYNTHESE, LE CODAGE A TRES BAS DEBIT ET LA VERIFICATION DU LOCUTEUR INDEPENDANTE DU TEXTE - SONT BASES SUR DES UNITES DE TYPE SOUS-MOT, DEFINIES A L'AIDE D'UN SAVOIR-FAIRE PHONETIQUE. CETTE THESE PORTE SUR UNE APPROCHE ALTERNATIVE : UNE DETERMINATION DES UNITES A L'AIDE DES TECHNIQUES ALISP (TRAITEMENT AUTOMATIQUE DE PAROLE, INDEPENDANT DE LA LANGUE). LA METHODE PROPOSEE COMPORTE DEUX ETAPES : PREMIEREMENT, L'ENSEMBLE DES UNITES EST DEFINI ET UNE TRANSCRIPTION INITIALE DE LA BASE DE DONNEES DE PAROLE EST OBTENUE ; NOUS AVONS UTILISE DES TECHNIQUES DE DECOMPOSITION TEMPORELLE (DT), DE CLASSIFICATION NON-SUPERVISEE ET DES MULTIGRAMMES. ENSUITE, NOUS MODELISONS LES UNITES A L'AIDE DES MODELES DE MARKOV CACHES (HMM). LA PREMIERE APPLICATION TESTEE A ETE EN CODAGE DE PAROLE A TRES BAS DEBIT. NOUS AVONS DU RESOUDRE DES PROBLEMES SPECIFIQUES A LA RE-SYNTHESE DANS LE DECODEUR. EN UTILISANT L'ENSEMBLE D'UNITES DONNE, NOUS AVONS OBTENU UN SIGNAL DE PAROLE INTELLIGIBLE AU DEBIT MOYEN DE 120 BPS (POUR LE CODAGE DES UNITES) DANS DEUX JEUX D'EXPERIENCES DEPENDANTES DU LOCUTEUR. DANS UNE DEUXIEME APPLICATION, NOUS AVONS UTILISE CES UNITES COMME PRE-TRAITEMENT D'UN SYSTEME DE VERIFICATION SEGMENTAL, BASE SUR DES PERCEPTRONS MULTI-COUCHE (MLP). NOUS AVONS MONTRE QUE LE SYSTEME SEGMENTAL OBTENAIT DES PERFORMANCES COMPARABLES A UN SYSTEME AVEC UNE DETERMINATION GLOBALE DES SCORES. NOUS AVONS ETUDIE LA CORRESPONDANCE ENTRE UNE SEGMENTATION ALISP ET UNE TRANSCRIPTION PHONETIQUE : NOUS AVONS TROUVE UNE CORRESPONDANCE CONSISTANTE, SI BIEN QU'ELOIGNEE D'UNE CORRESPONDANCE BIUNIVOQUE. NOUS DISCUTONS PAR AILLEURS, DIFFERENTES VOIX POSSIBLES D'UTILISATION DES UNITES ALISP EN RECONNAISSANCE DE PAROLE.
ALGORITHMES DE CODAGE ET DE MODIFICATIONS DES PARAMETRES PROSODIQUES POUR LA SYNTHESE DE PAROLE A PARTIR DU TEXTE

NOUS PROPOSONS DANS CETTE THESE UN CERTAIN NOMBRE DE SOLUTIONS PERMETTANT D'AMELIORER DE FACON SIGNIFICATIVE LA QUALITE DE SON PRODUITE PAR UN SYSTEME DE SYNTHESE DE PAROLE PROCEDANT PAR CONCATENATION D'UNITES ACOUSTIQUES. LE SYSTEME PROPOSE S'ARTICULE AUTOUR D'UN CODEUR PREDICTIF A DEBIT VARIABLE ET D'UN ALGORITHME TEMPOREL DE CONCATENATION DES UNITES ACOUSTIQUES ET DE MODIFICATION DE PARAMETRES PROSODIQUES DE LA VOIX. LE CODEUR ADAPTE SON DEBIT EN FONCTION DE LA QUANTITE D'INFORMATIONS PERTINENTS SUR LE PLAN PERCEPTIF PRESENTE DANS LE SEGMENT A CODER. IL UTILISE UNE EXCITATION PAR CODES STRUCTURES, POUR LESQUELS DES ALGORITHMES RAPIDES DE RECHERCHE DES CODES OPTIMAUX ONT ETE DEVELOPPES. CEUX-CI PERMETTENT DE METTRE EN UVRE DES DICTIONNAIRES D'EXCITATION DE CARDINAUX ELEVES, QUI ASSURENT UNE BONNE QUALITE DE RESTITUTION. POUR MANIPULER LES PARAMETRES PROSODIQUES, NOUS AVONS DEVELOPPE UNE TECHNIQUE ORIGINALE, QUI PROCEDE PAR ADDITION ET RECOUVREMENT, DANS LE DOMAINE TEMPOREL, DE SIGNAUX A COURT-TERME EXTRAITS DU SIGNAL D'ANALYSE PAR FENETRAGE SYNCHRONE DE LA FREQUENCE FONDAMENTALE. CETTE METHODE PRESENTE LE DOUBLE AVANTAGE D'ETRE PEU COUTEUSE EN TEMPS CALCUL ET D'AUTORISER DES MODIFICATIONS IMPORTANTES DES PARAMETRES PROSODIQUES TOUT EN CONSERVANT UNE BONNE QUALITE DE TIMBRE. NOUS DONNONS DANS CETTE THESE UN FONDEMENT THEORIQUE A CETTE OPERATION DE SYNTHESE SUR LA BASE D'UN MODELE SIMPLE MAIS REALISTE DE SON VOISE STATIONNAIRE ET NOUS ELUCIDONS LES RELATIONS DE CETTE METHODE AVEC LES TECHNIQUES FREQUENTIELLES, BEAUCOUP PLUS COUTEUSES EN TEMPS DE CALCUL, DEVELOPPEES PRECEDEMMENT