大字集手寫中文辨識系統中大分類模組的加速法

標題:	大字集手寫中文辨識系統中大分類模組的加速法 Speed improvement on coarse classification of handprinted chinese characters with large category set
作者:	蔡正煜 CAI, ZHENG-YU 李鍚堅 LI, SI-JIAN 資訊科學與工程研究所
關鍵字:	大字集手寫;中文辨識系統;大分類模組;加速法
公開日期:	1991
摘要:	在這篇論文中，我們提出了對於大字集手寫中文辨識系統中大分類模組的加速方法。這些方法是基於手寫中文字的統計分析。在這篇論文的第一部份，提出一個稱為多階前候選字選擇(multi-stage pre-candidate selection) 的方法。每一階層利用一個純量特徵(scalar feature)去減少候選字集合的大小。可以利用的最大階層數可由每個特徵的縮減率(reduction rate)來預測，使前候選字選擇與候選字選擇 (candidate selection) 的總共執行時間達到最小。每個特徵的使用先後順序是根據其縮減率來安排。在實驗中，我們使用大量的手寫中文字來證明此預測的正確性。第二部份，利用前面的觀念將資料庫中的中文字組織成決策樹(decision tree) 。然後對每一個輸入，我們只需要做一序列的簡單比較即可得到一個候選字集。我們提出一個基於候選字集大小縮減能力的演算法來建構此決策樹。建構過程包括特徵選擇(feature selection) ，分類機率分析 (classification probability analysis) 與新終端節點的產生。實驗結果顯示，在一定的正確率與縮減率之下，大分類的執行時間可縮減50﹪以上。最後我們也討論這兩種方法間的關係並加以比較。
URI:	http://140.113.39.130/cdrfb3/record/nctu/#NT802393057 http://hdl.handle.net/11536/55894
顯示於類別：	畢業論文