以頻譜分佈文字碼辨認國語連續語音

標題:	以頻譜分佈文字碼辨認國語連續語音
作者:	郭士義 GUO, SHI-YI 魏凌雲 WEI, LING-YUN 電信工程研究所
關鍵字:	頻譜能量分佈比例;中文;聲調語言;辨認;字彙;雙音詞;句型;SERC
公開日期:	1988
摘要:	此篇論文，我們利用頻譜能量分佈比例嗎（SERC）建立一個中文連續語音辨認系統。這個參數不但簡單而且能夠充分地代表聲音的特性，同時也不需要很複雜的運算。由 SERC再進一步加以成為頻譜分佈文字碼（SDLC）。我們巷辨認所採用的字彙共有155 個，其中包括了56個單音字，905 個雙音字詞和45個參音詞。值得注意的一點是，我們使用了一種特質相似程度比較器（PE74C ），這個硬體裝置可以依據我們輸入的文字碼，協助我們由龐大的資料庫中選出一些與測試字碼最為相似的候選者，以便進一步作字詞間的距離計算測量。這個機器使得我們必須作距離量測的資料量減少了數十倍，因此不但加快了辨認的速度，也提高了辨認率。在字彙辨認方面，可以看作是一種雙層濾網的程序。首先用PE474C比較SDLC間的相似程度，再由編碼中挑選出16個最為近似的資料；第二步驟，計算測試字彙和這些候選者的距離，退出距離值最小者作出為輸出結果。句子的辨認過程和字詞的辨認認方法類似，利用人說話時字詞間短暫的無聲時距，先將句子切割成數個基本單位。再由中文句子的結構編成句型碼，同樣用PE474C挑出一些句型碼較為近似的資料，作各個對應單位的距離量測及最後決定。雖然905 個雙音詞的辨認率約其有64％，但155 個句子的辨認率可以達到98％。這是因為中文語音的結構可以視為單音字，雙音詞及三音詞簡等小單位所組合而成。利用此特點，中文連續語音辨認的實用性將較為可行。
URI:	http://140.113.39.130/cdrfb3/record/nctu/#NT772436011 http://hdl.handle.net/11536/53965
Appears in Collections:	Thesis