標題: 2.4Kbps位元率語音編碼技術
A 2.4Kbps Bit Rate Speech Coding Technique
作者: 林信安
Lin, Xin-An
林進燈
Lin, Jin-Deng
電控工程研究所
關鍵字: 自動控制工程;控制工程;電腦;非週期性脈衝;適應性後處理濾波器;平均意見分數;AUTOMATED-CONTROL-ENGINEERING;CONTROL-ENGINEERING;COMPUTER
公開日期: 1995
摘要: 廣為人知的F.S.1016CELP4.8Kbps技術不僅能產生低位元率的語音壓縮,而且能保持 高音質的合成語音。然而,因為通訊頻道容量和貯存量被限制,所以在現今以較低位 元率(低於4.8Kbps)來表示語音訊號是重要的。傳統的線性預估編碼vocoder(LPC vocoder)能夠在2.4Kbps產生可理解的語音,但是它們時常產生不自然的聲音,如嗡 嗡聲、砰砰聲、與音調雜音。這些問題起源於每個音框用週期性脈衝列(periodic pulse train),僅以一個位元來決定有聲或無聲,和不正確的增益評估。在這論文 提出改良型LPC vocoder,它是基於傳統LPC vocoder結構,在這個編碼器,為了產生 更自然的合成語音,我們將使用非週期性脈衝(aperiodic pulse),四分之一音框 之有聲╱無聲的決策(quarter voiced/unvoiced decision),和基於包絡形狀( envelope shape)的增益評估。非週期性脈衝能減少在LPC頻譜的尖峭端點所導致不 自然聲音,四分之一音框之有聲╱無聲的決策是把語音訊號的音框區分成四個次音框 ,再對每個次音框來決定有聲或無聲,增益評估是仗用一個閉迴路分析合成法技術來 執行,它使原始語音訊號的包絡形狀能與合成語音訊號的包絡形狀一致,來獲得更乾 淨、更平滑的語音輸出。雖然改良型LPC vocoder的性能是可接受的,但仍然有雜音 。因此,我們使用適應性後處理濾波器(adaptive postfilter)來改善合成語音的 聽覺品質。此外,我們使用格子狀向量量化(lattice vector quantization)技術 的特性(儘可能使用較少位元而染減少語音品質),來量化線頻譜對(linear spectrum pair)參數,這格子狀向量量化僅需要較少記憶體和低複雜度的計算量。 平均意見分數(mean opinion score)指出改良型LPC vocoder所實現的音質優於現 存LPC-10版本。
URI: http://140.113.39.130/cdrfb3/record/nctu/#NT844327003
http://hdl.handle.net/11536/61161
顯示於類別:畢業論文