標題: | 中文連續語音聲調辨認 |
作者: | 賀中鼎 HE, ZHONG-DING 陳信宏 CHENG, XIN-HONG 電信工程研究所 |
關鍵字: | 信號處理;國語;辨認;網路;向量;聲調語言;VOICE;SINGAL-PROCESS;CHINESE;RECOGNITION;NETWORK;TONE-LANGUAGE |
公開日期: | 1988 |
摘要: | 語言獨立,不限定文句的連續語音辨認是語音信號處理領域中最重要的課題之一。因 為國語是一種聲調語言,所以,對國語而言,這項工作可以分為兩個部份:辨認聲調 及辨認411 個第一聲的詞素。在這篇論文中,我們討論中文連續語音聲調辨認。 本論文中,統計辨認過程被採用來建立一個網路,這個網路包括產生聲調的知道並同 時決定在同一句中的所有聲調,最大後置條件機率法則和艾特比搜尋法則支持這網路 的運作。在訓練的過程中,我們用向量量化的技術去造一個有256 個碼字的通用碼本 。然後,再求出所有訓練用的特徵向量與個碼字及聲調間的分佈情形。這種分佈情形 就用來代表聲調與特徵向量之間的機率統計情形。如果訓練用的特微向量夠多,則這 種統計機率就可實在地反映出聲調的特性。在辨認的過程中,從上述的統計機率中得 到須要的機率,配合最大後置條件機率法則和艾特比搜尋法則去得到最佳的聲調組合 。另外,三種聲調值除權的方法,四種利用聲調長度的策略及四種辨認法則被提出用 來克服存在於中文連續音的斜下及連音效應,並消除正交擴展法的缺點。得到的最好 辨認率是76.28 %,並做以下之結論: 一、聲調值除權,就連續聲調辨認來說,是非常重要的。 二、簡單且有效的利用聲調長度於辨認是今後的研究課題之一。 三、由右至左的連音效應似乎弘乎由右至左的連音效應。 |
URI: | http://140.113.39.130/cdrfb3/record/nctu/#NT772436001 http://hdl.handle.net/11536/53954 |
顯示於類別: | 畢業論文 |