標題: | 一套具有上下文後處理模組之手寫中文文句辨識系統 |
作者: | 王念祺 WANG,NIAN-QI 李錫堅 LI,XI-JIAN 資訊科學與工程研究所 |
關鍵字: | 上下文後處理模組;中文文句辨識系統;LINE APPROXIMATION;LINE SEGMENTS MERGING;NORMALIZATION;DYNAMIC PROGRAMMING;GREEDY MATCHING;COARSE CLASSIFICATION |
公開日期: | 1989 |
摘要: | 在這篇論文中, 我們提出一套手寫中文文句之辨識系統。一開始, 我們先利用直線逼 近(lineapproximation) 、線段接合(line segments merging) 和正規化(normaliza tion) 三個步驟來取出中文字中的所有線段。接著,我們計算每個線段的角度(slope ) 、長度(length)以及它們在X 軸和Y 軸方向上的順序(ordinal) 作為它們的特徵。 接下來,依據這些特微,我們利用動態規劃(dynamic programming) 及貪婪比對(gre edy matching) 兩種不同的方法分別計算出兩個中文字間的差距(distance),而資料 庫中與輸入字元差距最小的字元即為比對之結果。最後,我們提出一個以詞性為主的 上下文後處理方式(contextual postprocessing) 來修正經比對後產生的錯誤辨識結 果。此外,為了減少比對所需的時間,我們利用線段的數目、角度等特徵來進行簡單 的大分類(coarse classification) 。到目前為止,系統資料庫中共餼了150 個常用 中文字, 使用動態規劃法及貪婪比對法之辨識率約為80% 及87% , 而使用上下文後處 理約可提高系統10% 之辨識率。 |
URI: | http://140.113.39.130/cdrfb3/record/nctu/#NT782392065 http://hdl.handle.net/11536/54471 |
顯示於類別: | 畢業論文 |