標題: 非特定語者之中文詞語辨識
Speaker-Independent Mandarin Polysyllabic Word Recognition
作者: 陳柏琳
Chen, Bo-Lin
劉啟民
Liu, Qi-Min
資訊科學與工程研究所
關鍵字: 詞語辨識;資訊;電腦科學;CONTEXT-INDEPENDENT INITIAL MODEL;RIGHT-CONTEXT-INDEPENDENT INITIAL MODEL;RIGHT-CONTEXT-INDEPENDENT NULL-INITIAL MODEL;INFORAMTION;COMPUTER-SCIENCE
公開日期: 1995
摘要: 本論文從兩個主要的觀點來考量及設計一個非特定語者的中文多音節詞語辨識( speaker-independent Mandarin polysyllabic word recognition)系統:語音模型 的建立與辨識速度。我們嘗試增加訓練資料量並且改進語音聲韻特徵的模型,以期達 到提升辨識率的目標。基於中文聲韻的特性,本論文設計與實驗了三種語音模型: context-independent INITIAL model、 right-context-dependent INITIAL model 及right-context-dependent null-INITIAL model。最好的語音模型在500字詞、 5000字詞、25000字詞的系統,top 1詞的辨識率平均可達到99.1%、93.7%、83.6% ,而top 3詞則平均可達到 99.8 %、98.5 %、95.2 %。基於上述的辨識結果,我 們考慮利用搜尋演算法來增進搜尋的效率。由於tree-trellis search有能力大量縮 減搜尋時所需的運算時間並且不會降低系統的辨識率,本論文採用此種演算法作為研 究搜尋效率的基本架構,並且進而討論與分析四種執行tree-trellis search的技巧 。為了與tree-trellis search做比較,我們更進一步發展一種我們稱之為 fawt-match search的beam search演算法。實驗轡果顯示tree-trellis search顯著 地比其他搜尋演算提供較佳的搜尋速度,並且可以使搜尋時間降低成幾乎與詞庫的大 小無關。最後,我們建立了一套及時(real-time)的展示系統於Pentium-90的PC, 以作為大量測試之用。
URI: http://140.113.39.130/cdrfb3/record/nctu/#NT844392007
http://hdl.handle.net/11536/61197
Appears in Collections:Thesis