標題: 利用語音頻譜動態特徵辨認國語語音
作者: 盧文祥
LU,WEN-XIANG
李其昌
魏凌雲
LI,QI-CHANG
WEI,LING-YUN
資訊科學與工程研究所
關鍵字: 語音頻譜;動態特徵;辨認;國語語音;語音辨認;頻譜能量比例碼;字串比對器;(SERC);(PF474C)
公開日期: 1989
摘要: 語音頻譜動態特徵和靜態特徵在語音辨認上,同樣扮演一個重要的特性,因為動態特 徵包含音素之間的轉移訊息。在這篇論文我們利用頻譜能量比例碼(SERC)的動態特徵 和靜態特徵組合,加上二元樹向量量化技巧建立一個多字彙的語音辨認系統。 為了提高系統的辨認速度,我們使用了一個快速的相似性字串比對器(PF474C),這個 比對器可以迅速地從參考資料庫中選出16個最相似的候選詞。然後計算測試詞和這些 候選詞的距離,距離最短者即為辨認詞。 我們利用上述方法做了一些實驗,對於多特定語者(multiple-speaker)和非特定語者 (speaker-independent) 之辨認,辨認率分別提高了2.1%和11.4% 。根據這些結果顯 示,利用SERC的動態特徵和靜態特徵組合,對於非特定語者語音驗辨認是非常有效的 。
URI: http://140.113.39.130/cdrfb3/record/nctu/#NT782392036
http://hdl.handle.net/11536/54438
顯示於類別:畢業論文