一套具有上下文後處理模組之手寫中文文句辨識系統

標題:	一套具有上下文後處理模組之手寫中文文句辨識系統
作者:	王念祺 WANG,NIAN-QI 李錫堅 LI,XI-JIAN 資訊科學與工程研究所
關鍵字:	上下文後處理模組;中文文句辨識系統;LINE APPROXIMATION;LINE SEGMENTS MERGING;NORMALIZATION;DYNAMIC PROGRAMMING;GREEDY MATCHING;COARSE CLASSIFICATION
公開日期:	1989
摘要:	在這篇論文中, 我們提出一套手寫中文文句之辨識系統。一開始, 我們先利用直線逼近(lineapproximation) 、線段接合(line segments merging) 和正規化(normaliza tion) 三個步驟來取出中文字中的所有線段。接著，我們計算每個線段的角度(slope ) 、長度(length)以及它們在X 軸和Y 軸方向上的順序(ordinal) 作為它們的特徵。接下來，依據這些特微，我們利用動態規劃(dynamic programming) 及貪婪比對(gre edy matching) 兩種不同的方法分別計算出兩個中文字間的差距(distance)，而資料庫中與輸入字元差距最小的字元即為比對之結果。最後，我們提出一個以詞性為主的上下文後處理方式(contextual postprocessing) 來修正經比對後產生的錯誤辨識結果。此外，為了減少比對所需的時間，我們利用線段的數目、角度等特徵來進行簡單的大分類(coarse classification) 。到目前為止，系統資料庫中共餼了150 個常用中文字, 使用動態規劃法及貪婪比對法之辨識率約為80% 及87% , 而使用上下文後處理約可提高系統10% 之辨識率。
URI:	http://140.113.39.130/cdrfb3/record/nctu/#NT782392065 http://hdl.handle.net/11536/54471
Appears in Collections:	Thesis