神經網路用於國語語音辨認之研究

標題:	神經網路用於國語語音辨認之研究 The Study of Neural Networks for Mandarin Speech Recognition
作者:	陳信宏 CHEN SIN-HORNG 國立交通大學電信工程學系
關鍵字:	中文;語音識別;階層結構;遞迴類神經網路;Chinese;Speech recognition;Hierarchical structure;Recurrent neural network
公開日期:	1995
摘要:	本計畫主要探討應用遞迴式類神經網路做中文語音辨認.第一年擬進行多語者408單音節辨認之研究,解決類神經網路語音辨認系統 Scaling至大字彙時所面臨的問題.方法為採用階層式網路架構,以22個Initial及39個Final為基本辨認單位,使用兩個遞迴式神經網路分別辨認 Initial與Final,以縮小網路之Size.並在上層加上切割與加權網路,使Initial與Final網路能分開訓練, 以縮短訓練時間,同時對Initial與Final網路的輸出,給予不同的加權,提高辨認率.另外,將增加兩個網路,分別對字首"Stop"音及字尾鼻音再做特殊處理,以求再進一步提高辨認率.研究的重點在於:(1)適合中文408單音節辨認之階層式遞迴網路架構之建立;(2)各遞迴網路之個別訓練與最後之整合訓練;(3)"Stop"音與鼻音之特殊處理.預期完成後之中文語音辨認系統具有下列功能:(1)將TL提供之多語者Database(13人)的辨認率由CHMM法的72%提昇到大於80%;(2)相對於一般類神經網路在訓練時間上的緩慢冗長,本系統可以用分散式的訓練法則快速地訓練而成,同時便利系統之擴充.第二、三年之研究將以第一年的研究成果為基礎,進行系統之改進與整合;第二年之研究項目為:(1)語者獨立之408音節辨認; (2)整合聲調辨認成為1300音辨認系統;第三年之研究項目為:(1)1300音即時辨認系統之製作;(2)與另兩計畫之系統整合,以期完成一良好的國語電腦輸入系統.
官方說明文件#:	NSC84-2213-E009-037
URI:	http://hdl.handle.net/11536/96798 https://www.grb.gov.tw/search/planDetail?id=136042&docId=22626
Appears in Collections:	Research Plans