標題: 國語語音韻律片語之初步研究
A Preliminary Study on Modelling Prosodic Phrases for Mandarin Speech
作者: 謝吉慶
Chi-Ching Hsieh
陳信宏
Dr. Sin-Horng Chen
電信工程研究所
關鍵字: 韻律片語;語言模型;詞類;分歧度;簡單遞迴神經網路;有限狀態網路;Prosodic Phrases;Language Model;Part of Speech;Perplexity; Simple Recurrent Net;Finite State Network
公開日期: 1992
摘要: 本論文的研究動機在語音辨認方面係研究將聲學上的韻律訊息應用在語言 模型上的可行性,並評估其有效性;而在語音合成方面,則是希望是否能 以非規則法的方式產生出較高階的韻律訊息。在論文中我們介紹了如何抽 取與韻律訊息有關的參數,如停頓參數、延長參數、能量參數和基頻動態 參數。並設計出自動的連接狀態偵測器,以便偵測出語音句子中的韻律訊 息,並將此韻律訊息與語言模型相結合,而更進一步地降低了語言的複雜 度(亦即『分歧度』),如此將對語音辨認的工作有所助益。此外,我們亦 設計了簡單遞迴神經網路,將上述的理論結果應用於詞類預測器上,並證 明連接狀態的加入的確可以增加預測能力 (在Top 5 的正確預測率上約可 提昇5%左右)。而且我們亦使用『有限狀態網路』的觀念,來解釋簡單遞 迴神經網路所學得的文法及韻律知識儲存模式。至於語音合成方面,簡單 遞迴神經網路在連接狀態的預測上,亦有不錯的表現,約 82%左右的正確 預測率,這顯示了欲以非規則法的方式來合成更具全域性的韻律片語訊息 ,而產生較符合說話習慣的語音是可期待的。
URI: http://140.113.39.130/cdrfb3/record/nctu/#NT810436008
http://hdl.handle.net/11536/56988
Appears in Collections:Thesis