標題: 神經網路用於國語語音辨認之研究
The Study of Neural Networks for Mandarin Speech Recognition
作者: 陳信宏
CHEN SIN-HORNG
國立交通大學電信工程學系
關鍵字: 中文;語音識別;階層結構;遞迴類神經網路;Chinese;Speech recognition;Hierarchical structure;Recurrent neural network
公開日期: 1995
摘要: 本計畫主要探討應用遞迴式類神經網路做 中文語音辨認.第一年擬進行多語者408單音節 辨認之研究,解決類神經網路語音辨認系統 Scaling至大字彙時所面臨的問題.方法為採用階層式網路架構,以22個Initial及39個Final為基本辨 認單位,使用兩個遞迴式神經網路分別辨認 Initial與Final,以縮小網路之Size.並在上層加上切 割與加權網路,使Initial與Final網路能分開訓練, 以縮短訓練時間,同時對Initial與Final網路的輸 出,給予不同的加權,提高辨認率.另外,將增加 兩個網路,分別對字首"Stop"音及字尾鼻音再做 特殊處理,以求再進一步提高辨認率.研究的重 點在於:(1)適合中文408單音節辨認之階層式遞迴網路架構之建立;(2)各遞迴網路之個別訓練 與最後之整合訓練;(3)"Stop"音與鼻音之特殊處 理.預期完成後之中文語音辨認系統具有下列 功能:(1)將TL提供之多語者Database(13人)的辨認率 由CHMM法的72%提昇到大於80%;(2)相對於一般類神 經網路在訓練時間上的緩慢冗長,本系統可以 用分散式的訓練法則快速地訓練而成,同時便 利系統之擴充.第二、三年之研究將以第一年 的研究成果為基礎,進行系統之改進與整合;第 二年之研究項目為:(1)語者獨立之408音節辨認; (2)整合聲調辨認成為1300音辨認系統;第三年之 研究項目為:(1)1300音即時辨認系統之製作;(2)與 另兩計畫之系統整合,以期完成一良好的國語 電腦輸入系統.
官方說明文件#: NSC84-2213-E009-037
URI: http://hdl.handle.net/11536/96798
https://www.grb.gov.tw/search/planDetail?id=136042&docId=22626
Appears in Collections:Research Plans