Title: 校園公文處理系統的設計
Design of a Campus Document Processing System
Authors: 沈友瑋
Shen, You-Wei
李錫堅
Lee Hsi-Jian
資訊科學與工程研究所
Keywords: 公文;校園公文;公文處理;字元辨識;文件分析;document;campus document;document processing;character recognition;document analysis
Issue Date: 1996
Abstract: 本論文提出一套校園公文處理系統。在學習階段中,系統會抽取空白表格
的實體結構(physical structure)以及相對結構(relative structure)以
建立樣本表格資料庫。在辨識階段中,系統先會利用輸入的表格公文的實
體結構來確認表格的型態以找出表格公文的樣本,並且利用樣本中的相對
結構來解譯表格公文的內容。首先系統會利用調整臨界值(adaptive
threshold)的方法對公文影像作二值化,並利用strip-projection的方法
將表格公文的實體結構抽取出來。然後根據表格格線的寬度,將格線去除
而跟格線接觸的文字的形狀仍然被保留下來。我們利用Connect
Component的方法將文字切割出來。並利用一統計式的OCR模組來作字元辨
識。最後再用一個常用詞的辭典對辨識結果作矯正。在本論文中亦提出一
套描述表格邏輯結構(logical structure)的方法。目前,系統切字的正
確率是94.45%。我們比對表格公文的正確率,在公文沒有旋轉的情況下
是85%,而有旋轉的情況下80%。
URI: http://140.113.39.130/cdrfb3/record/nctu/#NT850392036
http://hdl.handle.net/11536/61786
Appears in Collections:Thesis