標題: 校園公文處理系統的設計
Design of a Campus Document Processing System
作者: 沈友瑋
Shen, You-Wei
李錫堅
Lee Hsi-Jian
資訊科學與工程研究所
關鍵字: 公文;校園公文;公文處理;字元辨識;文件分析;document;campus document;document processing;character recognition;document analysis
公開日期: 1996
摘要: 本論文提出一套校園公文處理系統。在學習階段中,系統會抽取空白表格 的實體結構(physical structure)以及相對結構(relative structure)以 建立樣本表格資料庫。在辨識階段中,系統先會利用輸入的表格公文的實 體結構來確認表格的型態以找出表格公文的樣本,並且利用樣本中的相對 結構來解譯表格公文的內容。首先系統會利用調整臨界值(adaptive threshold)的方法對公文影像作二值化,並利用strip-projection的方法 將表格公文的實體結構抽取出來。然後根據表格格線的寬度,將格線去除 而跟格線接觸的文字的形狀仍然被保留下來。我們利用Connect Component的方法將文字切割出來。並利用一統計式的OCR模組來作字元辨 識。最後再用一個常用詞的辭典對辨識結果作矯正。在本論文中亦提出一 套描述表格邏輯結構(logical structure)的方法。目前,系統切字的正 確率是94.45%。我們比對表格公文的正確率,在公文沒有旋轉的情況下 是85%,而有旋轉的情況下80%。
URI: http://140.113.39.130/cdrfb3/record/nctu/#NT850392036
http://hdl.handle.net/11536/61786
Appears in Collections:Thesis