標題: | 以有限狀態機辨識大詞彙連續中文語音 Large Vocabulary Continuous Mandarin Speech Recognition Using Finite-State Machine |
作者: | 姜翔耀 Chang Shiang-Yao 陳信宏 電信工程研究所 |
關鍵字: | 中文大詞彙語音辨識;有限狀態機;Speech Recognition |
公開日期: | 2008 |
摘要: | 近年來,有限狀態機已廣泛使用於語音辨認、語音合成及對話管理。本論文正是以有限狀態機辨識大詞彙中文語音系統之實作,以有限狀態機發展之語音辨識器,可以將聲學模型、發音辭典及語言模型分別表示為有限狀態機,並進一步將這些有限狀態機,整合為單一有限狀態機,便可得到完整的語音辨認搜尋空間。本論文可分為四部份:第一部份是有限狀態機的基本定義。而第二部份,我們將傳統語音辨識所使用的聲學模型、發音詞典和語言模型建立成有限狀態機。第三部份,我們發展一個「合併演算法」來減少各有限狀態機的狀態及轉移數目,並探討如何以「組合演算法」將搜尋空間整合起來,再將整合好的搜尋空間以維持比光束搜尋,得到辨認結果。最後,我們以TCC300作為此辨認系統的測試語料,實驗結果得到之詞辨認率、字元辨認率和音節辨認率分別為52.1、72.4及83.5,大致與HTK辨識結果相當,以此證明系統的正確性。 |
URI: | http://140.113.39.130/cdrfb3/record/nctu/#GT009513628 http://hdl.handle.net/11536/38477 |
Appears in Collections: | Thesis |
Files in This Item:
If it is a zip file, please download the file and unzip it, then open index.html in a browser to view the full text content.