以語音段落為單位之中文連續語音辨認

標題:	以語音段落為單位之中文連續語音辨認 A Segment-based Recognition System for Continuous Mandarin Speech
作者:	洪維廷 Wei-Tyng Hong 陳信宏 Dr. Sin-Horng Chen 電信工程研究所
關鍵字:	語音辨認;音段;先切割;;speech recognition;speech segment;pre-segmentation;
公開日期:	1992
摘要:	本論文之主要目的在建立一個以語音段落(音段)為單位之中文連續語音辨認系統。語音信號在時間上為一變化緩慢的信號，在相鄰的音框之間有著強烈的相關性而非個別獨立，我們期望能經由以音段作為比對的基本單位而將音框間相關性引入。我們將一個語音信號視為一連串的聲學音段的連結。其中每一個音段則大略的代表一個『聲學事件』。對每一個音段則以一個固定維度的特徵參數向量來代表。我們以『動態時間校準法』為辨認基礎，並且根據以音段為比對單位時所需考慮的情形加以改良，成為以音段為基礎的動態時間校準方法。以此方法所得之『不先切割式』辨認率為75.29\%，高於 7個狀態、5個混合數之CHMM辨認系統(70.4\%)約5\%。在改進系統的辨認速度方面，我們以『先切割系統』和預分類系統』，來降低搜尋空間，得到66.99\%的辨認率，只低於HMM辨認系統3.4\%，但速度提高了6.3倍。
URI:	http://140.113.39.130/cdrfb3/record/nctu/#NT810436009 http://hdl.handle.net/11536/56989
顯示於類別：	畢業論文