以統計模型為基礎的自然語言基週軌跡合成

標題:	以統計模型為基礎的自然語言基週軌跡合成
作者:	李蘇民 LI, SU-MIN 陳信宏 CHENG, XIN-HONG 電信工程研究所
關鍵字:	統計模式;中文;聲調語言;基週軌跡;合成技術;交通大學;文句;TONE-LANGUAGE
公開日期:	1988
摘要:	本論文提出了一個以統計模式為基礎的中文基週軌跡合成系統，用來產生自然中文語音的基週軌跡。由於國語是一種聲調語言（Tone language ），聲調還兼具辨義的作用，那麼聲調在國語語音合成技術裡的重要性正是不言可喻，所以本論文選擇聲調作為研究的對象。近年來，交通大學使用正交轉換對基週軌跡做特徵抽取，應用於編碼以及國語聲調辨認方向的研究，所以本論文嘗試將此技術應用於國語語音合成的自然基週軌跡產生，而其最終目標則是藉著文句音素與音韻成分的描述直接找出基週軌跡，期望能得到同樣良好的結果。論文中分析了大量語料，得到自然基迴軌跡向量，用以找出具代表性的自然軌跡碼書；經由向量量化編碼、統計建立了產生基週軌跡的統計模式，為了簡化此模式以利實際製作，我們採用了馬可夫模式（Markov Model）。系統的輸入是文句分析所得的音素及音韻資訊，輸出是代表基週軌跡的碼字串。當文句輸入時，使模式得到最大機率的碼字串，就是適合此輸入文句的最佳自然基週軌跡。為了系統功能的測試，定義了碼字正確率作為客觀測試的評估標準，碼字平均正確率最高可達71.6％，廣義的碼字平均正確率最高可達82.60 ％。另外採用了LPC 分析合成系統做非正式的主觀評估，以模式產生的基週取代原有的基週，其他參數保持不變。實驗的結果顯示，抽換基週後的合成語音絕大部分的句子聽起來都很自然，僅有少數的字因量化失真而有異常的現象，但仍然可識別。
URI:	http://140.113.39.130/cdrfb3/record/nctu/#NT772436009 http://hdl.handle.net/11536/53963
Appears in Collections:	Thesis