Optimisation D Un Sch Ma De Codage De La Parole Tr S Bas D Bit Par Indexation D Unit S De Taille Variable

Download Optimisation D Un Sch Ma De Codage De La Parole Tr S Bas D Bit Par Indexation D Unit S De Taille Variable PDF/ePub or read online books in Mobi eBooks. Click Download or Read Online button to get Optimisation D Un Sch Ma De Codage De La Parole Tr S Bas D Bit Par Indexation D Unit S De Taille Variable book now. This website allows unlimited access to, at the time of writing, more than 1.5 million titles, including hundreds of thousands of titles in various foreign languages.
Optimisation d'un schéma de codage de la parole à très bas débit, par indexation d'unités de taille variable

Cette thèse a pour but d'étudier un schéma de codage à très bas débit, de l’ordre de 500 bit/s, s’appuyant sur des techniques de reconnaissance et de synthèse vocale. Elle s'inscrit dans la continuité des travaux menés à la fois au cours du projet RNRT SYMPATEX et de la thèse de Cernocky. L’encodeur effectue une reconnaissance d’unités élémentaires de parole à l’aide de modèles de Markov cachés. Le décodeur intègre une approche de synthèse par concaténation d'unités acoustiques. Ce schéma exploite un grand corpus de parole stocké dans le système et organisé en une base de synthèse. L’encodeur y recherche les unités qui représentent au mieux la parole, puis transmet leurs indices ainsi que des paramètres prosodiques. Le décodeur y extrait les unités à concaténer pour restituer la parole. Les problèmes traités au cours de cette thèse portent sur l'amélioration de la qualité générale du schéma de codage. Une approche de sélection dynamique des unités est proposée à cet effet. De plus, le fonctionnement du schéma a été étendu à des conditions réalistes d'utilisation. Ainsi, le schéma est étudié dans plusieurs environnements bruyants et une méthode d’adaptation au bruit est proposée. L’extension au mode indépendant du locuteur est réalisée par un apprentissage conjoint sur un grand nombre de locuteurs, associé à une classification hiérarchique des locuteurs permettant de constituer un jeu de bases de synthèse proche du locuteur à coder. Enfin, la complexité du schéma est analysée et une méthode de compression de la base de synthèse est proposée
TRAITEMENT DE LA PAROLE S'APPUYANT SUR DES UNITES SEGMENTALES DETERMINEES AUTOMATIQUEMENT

LES SYSTEMES COURANTS DE TRAITEMENT AUTOMATIQUE DE LA PAROLE (TAP) - LA RECONNAISSANCE, LA SYNTHESE, LE CODAGE A TRES BAS DEBIT ET LA VERIFICATION DU LOCUTEUR INDEPENDANTE DU TEXTE - SONT BASES SUR DES UNITES DE TYPE SOUS-MOT, DEFINIES A L'AIDE D'UN SAVOIR-FAIRE PHONETIQUE. CETTE THESE PORTE SUR UNE APPROCHE ALTERNATIVE : UNE DETERMINATION DES UNITES A L'AIDE DES TECHNIQUES ALISP (TRAITEMENT AUTOMATIQUE DE PAROLE, INDEPENDANT DE LA LANGUE). LA METHODE PROPOSEE COMPORTE DEUX ETAPES : PREMIEREMENT, L'ENSEMBLE DES UNITES EST DEFINI ET UNE TRANSCRIPTION INITIALE DE LA BASE DE DONNEES DE PAROLE EST OBTENUE ; NOUS AVONS UTILISE DES TECHNIQUES DE DECOMPOSITION TEMPORELLE (DT), DE CLASSIFICATION NON-SUPERVISEE ET DES MULTIGRAMMES. ENSUITE, NOUS MODELISONS LES UNITES A L'AIDE DES MODELES DE MARKOV CACHES (HMM). LA PREMIERE APPLICATION TESTEE A ETE EN CODAGE DE PAROLE A TRES BAS DEBIT. NOUS AVONS DU RESOUDRE DES PROBLEMES SPECIFIQUES A LA RE-SYNTHESE DANS LE DECODEUR. EN UTILISANT L'ENSEMBLE D'UNITES DONNE, NOUS AVONS OBTENU UN SIGNAL DE PAROLE INTELLIGIBLE AU DEBIT MOYEN DE 120 BPS (POUR LE CODAGE DES UNITES) DANS DEUX JEUX D'EXPERIENCES DEPENDANTES DU LOCUTEUR. DANS UNE DEUXIEME APPLICATION, NOUS AVONS UTILISE CES UNITES COMME PRE-TRAITEMENT D'UN SYSTEME DE VERIFICATION SEGMENTAL, BASE SUR DES PERCEPTRONS MULTI-COUCHE (MLP). NOUS AVONS MONTRE QUE LE SYSTEME SEGMENTAL OBTENAIT DES PERFORMANCES COMPARABLES A UN SYSTEME AVEC UNE DETERMINATION GLOBALE DES SCORES. NOUS AVONS ETUDIE LA CORRESPONDANCE ENTRE UNE SEGMENTATION ALISP ET UNE TRANSCRIPTION PHONETIQUE : NOUS AVONS TROUVE UNE CORRESPONDANCE CONSISTANTE, SI BIEN QU'ELOIGNEE D'UNE CORRESPONDANCE BIUNIVOQUE. NOUS DISCUTONS PAR AILLEURS, DIFFERENTES VOIX POSSIBLES D'UTILISATION DES UNITES ALISP EN RECONNAISSANCE DE PAROLE.
Compression de la Parole

Le codage de la parole est essentiel pour l'obtention d'un usage plus efficace des r seaux de t l communication num riques, en particuliers les r seaux cellulaires, et pour r duire la m moire n cessaire dans les syst mes de stockage de la parole. La plupart des algorithmes de compression de parole tr s bas d bit binaire emploient le codage pr diction lin aire (LPC) qui repr sente le spectre court terme du signal de parole. Nous exposerons les diff rentes m thodes de codage des param tres spectraux. On utilisera une quantification vectorielle divis e (SVQ) et la quantification vectorielle l'aide d'un r seau r gulier de points pour le codage des param tres spectraux (fr quences de raies spectrales LSF). Nous avons ensuite imbriqu ce bloc de quantification dans le codeur CELP r alis au Centre de D veloppement des Technologies Avanc es (CDTA). Les mesures objectives et subjectives montrent que la parole est de bonne qualit .