標題: 一套具有上下文後處理模組之手寫中文文句辨識系統
作者: 王念祺
WANG,NIAN-QI
李錫堅
LI,XI-JIAN
資訊科學與工程研究所
關鍵字: 上下文後處理模組;中文文句辨識系統;LINE APPROXIMATION;LINE SEGMENTS MERGING;NORMALIZATION;DYNAMIC PROGRAMMING;GREEDY MATCHING;COARSE CLASSIFICATION
公開日期: 1989
摘要: 在這篇論文中, 我們提出一套手寫中文文句之辨識系統。一開始, 我們先利用直線逼 近(lineapproximation) 、線段接合(line segments merging) 和正規化(normaliza tion) 三個步驟來取出中文字中的所有線段。接著,我們計算每個線段的角度(slope ) 、長度(length)以及它們在X 軸和Y 軸方向上的順序(ordinal) 作為它們的特徵。 接下來,依據這些特微,我們利用動態規劃(dynamic programming) 及貪婪比對(gre edy matching) 兩種不同的方法分別計算出兩個中文字間的差距(distance),而資料 庫中與輸入字元差距最小的字元即為比對之結果。最後,我們提出一個以詞性為主的 上下文後處理方式(contextual postprocessing) 來修正經比對後產生的錯誤辨識結 果。此外,為了減少比對所需的時間,我們利用線段的數目、角度等特徵來進行簡單 的大分類(coarse classification) 。到目前為止,系統資料庫中共餼了150 個常用 中文字, 使用動態規劃法及貪婪比對法之辨識率約為80% 及87% , 而使用上下文後處 理約可提高系統10% 之辨識率。
URI: http://140.113.39.130/cdrfb3/record/nctu/#NT782392065
http://hdl.handle.net/11536/54471
Appears in Collections:Thesis