標題: 大字集手寫中文辨識系統中大分類模組的加速法
Speed improvement on coarse classification of handprinted chinese characters with large category set
作者: 蔡正煜
CAI, ZHENG-YU
李鍚堅
LI, SI-JIAN
資訊科學與工程研究所
關鍵字: 大字集手寫;中文辨識系統;大分類模組;加速法
公開日期: 1991
摘要: 在這篇論文中,我們提出了對於大字集手寫中文辨識系統中大分類模組的加速方法 。這些方法是基於手寫中文字的統計分析。在這篇論文的第一部份,提出一個稱為 多階前候選字選擇(multi-stage pre-candidate selection) 的方法。每一階層利 用一個純量特徵(scalar feature)去減少候選字集合的大小。可以利用的最大階層 數可由每個特徵的縮減率(reduction rate)來預測,使前候選字選擇與候選字選擇 (candidate selection) 的總共執行時間達到最小。每個特徵的使用先後順序是根 據其縮減率來安排。在實驗中,我們使用大量的手寫中文字來證明此預測的正確性 。第二部份,利用前面的觀念將資料庫中的中文字組織成決策樹(decision tree) 。然後對每一個輸入,我們只需要做一序列的簡單比較即可得到一個候選字集。我 們提出一個基於候選字集大小縮減能力的演算法來建構此決策樹。建構過程包括特 徵選擇(feature selection) ,分類機率分析 (classification probability analysis) 與新終端節點的產生。實驗結果顯示,在一定的正確率與縮減率之下, 大分類的執行時間可縮減50﹪以上。最後我們也討論這兩種方法間的關係並加以比 較。
URI: http://140.113.39.130/cdrfb3/record/nctu/#NT802393057
http://hdl.handle.net/11536/55894
顯示於類別:畢業論文