標題: | 一個針對小部分多種字體中文字辨認的新方法 |
作者: | 李遠坤 LI,YUAN-KUN 陳玲慧 資訊科學與工程研究所 |
關鍵字: | 多種字體;中文字辨認;特殊抽取;學習階段;辨認階段;錯誤估量值;隨機模型;筆劃配對;BRANCH-AND-BOUND;HOUGH-TRANSFORM |
公開日期: | 1990 |
摘要: | 本論文提出一個針對小部分多種字體中文字辨認的新方法。系統主要分成:物徵抽取 ,學習階段及辨認階段等三大部分。在特徵抽取部分之中。提出一個修正的Hough tr ansform 方法及筆劃趨勢的觀念,取出中文字的水平筆劃及垂直筆劃,作為中文字的 特徵。在學習階段之中,首先定義一個同類中文字之間筆劃配對的錯誤估量值。再根 據此錯誤估量值,找出二個同類中文字之間的最佳筆劃配對,記錄同類中文字每個筆 劃出現的機率,以建立每一類中文字的隨機模型。在辨認階段之中,定義另一偵類中 文字之間的筆劃配對的錯誤估量值。為了節省辨認階段之計算時間,提出一個可以找 到逼近最佳筆劃配對的方法。因為錯誤估量值的計算乃是累積所有水平筆劃及垂直筆 劃的錯誤估量值之和,所以可以利用branch-and-bound方法來縮短計算時間。對於所 有中文字的參考隨機模型,與輸入字之間具有實驗得知,最小辨認錯誤估量值與次小 辨認錯誤估量值之間具有相當大的差距,所以本系統有非常高的辨認率。除此,因為 使用隨機模型,記意體空間并不會隨著學習的中文字增加而增加,亦是本方法的特色 之一。 |
URI: | http://140.113.39.130/cdrfb3/record/nctu/#NT792394003 http://hdl.handle.net/11536/55244 |
顯示於類別: | 畢業論文 |