標題: 以語音段落為單位之中文連續語音辨認
A Segment-based Recognition System for Continuous Mandarin Speech
作者: 洪維廷
Wei-Tyng Hong
陳信宏
Dr. Sin-Horng Chen
電信工程研究所
關鍵字: 語音辨認;音段;先切割;;speech recognition;speech segment;pre-segmentation;
公開日期: 1992
摘要: 本論文之主要目的在建立一個以語音段落(音段)為單位之中文連續語音辨 認系統。語音信號在時間上為一變化緩慢的信號,在相鄰的音框之間有著 強烈的相關性而非個別獨立,我們期望能經由以音段作為比對的基本單位 而將音框間相關性引入。我們將一個語音信號視為一連串的聲學音段的連 結。其中每一個音段則大略的代表一個『聲學事件』。對每一個音段則以 一個固定維度的特徵參數向量來代表。我們以『動態時間校準法』為辨認 基礎,並且根據以音段為比對單位時所需考慮的情形加以改良,成為以音 段為基礎的動態時間校準方法。以此方法所得之『不先切割式』辨認率 為75.29\%,高於 7個狀態、5個混合數之CHMM辨認系統(70.4\%)約5\%。 在改進系統的辨認速度方面,我們以『先切割系統』和預分類系統』,來 降低搜尋空間,得到66.99\%的辨認率,只低於HMM辨認系統3.4\%,但速 度提高了6.3倍。
URI: http://140.113.39.130/cdrfb3/record/nctu/#NT810436009
http://hdl.handle.net/11536/56989
顯示於類別:畢業論文