標題: 一百個中文句子之語音辨認
作者: 李孫文
LI, SUN-WEN
魏凌雲
WEI, LIN-YUN
資訊科學與工程研究所
關鍵字: 中文句子;頻譜能量比例碼;單音詞;雙音詞;三音詞;辨認率;共振頻位碼;計算機;SERC;FFLC;INFORMATION-SCIENCE
公開日期: 1987
摘要: 本篇論文是採用頻譜能量比例碼 ( SERC ) 來作中文連續詞的辨認,此參數不但簡單 ,能夠表現聲音的特性,同時也不需複雜的運算。我們所辨認的共有112 個句子,其 中包括了 97 個單音詞,358 個雙音詞和4 個三音詞。 有一點很重要的是,我們使用了一種特質相似度比較器 ( PF474C ) ,這個機器可以 根據我們輸入的碼字,幫助我們從資料庫中選出 16 個與之最相似的候選者,以待進 一步作詞與詞距離之測量。這個機器使我們所需量測距離的對象降低了好幾倍,因此 不但加快辨認速度,也提高辨認率。在此我們以共振頻位碼 ( FFLC ) 作為此機器比 對的碼字。頻譜能量比例碼和共振頻位碼互相彌補對方特性不足之處,因此提供了語 音軏整的表示法。 在沒有的經過訓練的語者所說的句子辨認實驗中,雖然就單音詞和雙音詞的總辨認率 大約只有 65 % ,但是句子辨認率卻達到 98 - 99 %。這麼高的辨別率應歸功於中文 句子的語音結構單純的結果,因為中文可以視為由單音詞和雙音詞的示樣穿插構成的 ,這些示樣的組合也幫助了辨別率的提高。由實驗的結果,使我們深信中文語音辨認 的實際應用為期不遠。
URI: http://140.113.39.130/cdrfb3/record/nctu/#NT762241013
http://hdl.handle.net/11536/53270
Appears in Collections:Thesis