New Techniques Of Scalable Speech Audio Coding For Conversational Applications


Download New Techniques Of Scalable Speech Audio Coding For Conversational Applications PDF/ePub or read online books in Mobi eBooks. Click Download or Read Online button to get New Techniques Of Scalable Speech Audio Coding For Conversational Applications book now. This website allows unlimited access to, at the time of writing, more than 1.5 million titles, including hundreds of thousands of titles in various foreign languages.

Download

New Techniques of Scalable Speech/audio Coding for Conversational Applications


New Techniques of Scalable Speech/audio Coding for Conversational Applications

Author: Thi Minh Nguyet Hoang

language: en

Publisher:

Release Date: 2011


DOWNLOAD





Cette thèse développe de nouvelles techniques de codage de parole et audio scalables. Tout d'abord, une première méthode de codage par transformée des signaux de parole et audio scalable est présentée. Cette méthode est construite sur le principe de codage par plan de bits, qui est une technique efficace pour atteindre un codage progressif scalable. Cette technique décompose une séquence entière à coder en une succession de plans de bits, des bits les plus significatifs (MSB) aux bits les moins significatifs (LSB). Ces plans de bits dans le train binaire généré peuvent être arbitrairement tronqués lorsque certaines contraintes sont appliquées. Chaque plan de bits est ensuite converti en une séquence quinaire (+, -, 0, 1, EoP), où le symbole "EoP" (End of Plane) indique la fin du plan courant. Un codage arithmétique contextuel est finalement appliqué sur cette séquence quinaire. Pour exploiter la corrélation entre les plans de bits successifs, les plans ne sont pas codés de façon séquentielle (du premier bit au dernier bit), mais en deux passes, en fonction des plans précédemment codés. En plus des techniques scalables dans le codage mono, les techniques scalables dans le codage audio multicanal ont été également développées. Cette thèse propose deux techniques de downmix stéréo en mono dans le domaine fréquentiel. Ces deux techniques de downmix ont plusieurs avantages: conserver l'énergie des composantes spectrales et éviter de mettre le canal left (L) ou right (R) comme référence de phase. En particulier, la deuxième technique de downmix permet de plus d'éviter la dégradation de qualité du signal mono dans le cas où les deux canaux stéréo sont en quasi opposition de phase (voire même en opposition de phase dans le cas extrême). Construits sur ces deux techniques de downmix, deux modèles d'analyse-synthèse stéréo paramétriques sont décrits. Dans ces modèles, les paramètres stéréo par sous-bande se composent soit de différence intercanale d'intensité, soit de différence intercanale de temps, soit de différence intercanale de phase entre le signal mono et un des deux signaux stéréo (L ou R). Ces deux modèles de codage stéréo paramétrique sont appliqués à l'extension stéréo de l'UIT-T G.722 à deux modes: 56+8 et 64+16 kbit/s avec une longueur de trame de 5 ms.

Speech and Audio Processing for Coding, Enhancement and Recognition


Speech and Audio Processing for Coding, Enhancement and Recognition

Author: Tokunbo Ogunfunmi

language: en

Publisher: Springer

Release Date: 2014-10-14


DOWNLOAD





This book describes the basic principles underlying the generation, coding, transmission and enhancement of speech and audio signals, including advanced statistical and machine learning techniques for speech and speaker recognition with an overview of the key innovations in these areas. Key research undertaken in speech coding, speech enhancement, speech recognition, emotion recognition and speaker diarization are also presented, along with recent advances and new paradigms in these areas.

Principles of Digital Audio, Sixth Edition


Principles of Digital Audio, Sixth Edition

Author: Ken C. Pohlmann

language: en

Publisher: McGraw Hill Professional

Release Date: 2010-10-06


DOWNLOAD





The definitive guide to digital engineering--fully updated Gain a thorough understanding of digital audio tools, techniques, and practices from this completely revised and expanded resource. Written by industry pioneer and Audio Engineering Society Fellow Ken C. Pohlmann, Principles of Digital Audio, Sixth Edition, describes the technologies behind today's audio equipment in a clear, practical style. Covering basic theory to the latest technological advancements, the book explains how to apply digital conversion, processing, compression, storage, streaming, and transmission concepts. New chapters on Blu-ray, speech coding, and low bit-rate coding are also included in this bestselling guide. Learn about discrete time sampling, quantization, and signal processing Examine details of CD, DVD, and Blu-ray players and discs Encode and decode AAC, MP3, MP4, Dolby Digital, and other files Prepare content for distribution via the Internet and digital radio and television Learn the critical differences between music coding and speech coding Design low bit-rate codecs to optimize memory capacity while preserving fidelity Develop methodologies to evaluate the sound quality of music and speech files Study audio transmission via HDMI, VoIP, Wi-Fi, and Bluetooth Handle digital rights management, fingerprinting, and watermarking Understand how one-bit conversion and high-order noise shaping work