標題: 以頻譜分佈文字碼辨認國語連續語音
作者: 郭士義
GUO, SHI-YI
魏凌雲
WEI, LING-YUN
電信工程研究所
關鍵字: 頻譜能量分佈比例;中文;聲調語言;辨認;字彙;雙音詞;句型;SERC
公開日期: 1988
摘要: 此篇論文,我們利用頻譜能量分佈比例嗎(SERC)建立一個中文連續語音辨認系統。 這個參數不但簡單而且能夠充分地代表聲音的特性,同時也不需要很複雜的運算。由 SERC再進一步加以成為頻譜分佈文字碼(SDLC)。我們巷辨認所採用的字彙共有155 個,其中包括了56個單音字,905 個雙音字詞和45個參音詞。值得注意的一點是,我 們使用了一種特質相似程度比較器(PE74C ),這個硬體裝置可以依據我們輸入的文 字碼,協助我們由龐大的資料庫中選出一些與測試字碼最為相似的候選者,以便進一 步作字詞間的距離計算測量。這個機器使得我們必須作距離量測的資料量減少了數十 倍,因此不但加快了辨認的速度,也提高了辨認率。 在字彙辨認方面,可以看作是一種雙層濾網的程序。首先用PE474C比較SDLC間的相似 程度,再由編碼中挑選出16個最為近似的資料;第二步驟,計算測試字彙和這些候選 者的距離,退出距離值最小者作出為輸出結果。句子的辨認過程和字詞的辨認認方法 類似,利用人說話時字詞間短暫的無聲時距,先將句子切割成數個基本單位。再由中 文句子的結構編成句型碼,同樣用PE474C挑出一些句型碼較為近似的資料,作各個對 應單位的距離量測及最後決定。雖然905 個雙音詞的辨認率約其有64%,但155 個句 子的辨認率可以達到98%。這是因為中文語音的結構可以視為單音字,雙音詞及三音 詞簡等小單位所組合而成。利用此特點,中文連續語音辨認的實用性將較為可行。
URI: http://140.113.39.130/cdrfb3/record/nctu/#NT772436011
http://hdl.handle.net/11536/53965
顯示於類別:畢業論文