Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.author | 沈友瑋 | en_US |
dc.contributor.author | Shen, You-Wei | en_US |
dc.contributor.author | 李錫堅 | en_US |
dc.contributor.author | Lee Hsi-Jian | en_US |
dc.date.accessioned | 2014-12-12T02:17:16Z | - |
dc.date.available | 2014-12-12T02:17:16Z | - |
dc.date.issued | 1996 | en_US |
dc.identifier.uri | http://140.113.39.130/cdrfb3/record/nctu/#NT850392036 | en_US |
dc.identifier.uri | http://hdl.handle.net/11536/61786 | - |
dc.description.abstract | 本論文提出一套校園公文處理系統。在學習階段中,系統會抽取空白表格 的實體結構(physical structure)以及相對結構(relative structure)以 建立樣本表格資料庫。在辨識階段中,系統先會利用輸入的表格公文的實 體結構來確認表格的型態以找出表格公文的樣本,並且利用樣本中的相對 結構來解譯表格公文的內容。首先系統會利用調整臨界值(adaptive threshold)的方法對公文影像作二值化,並利用strip-projection的方法 將表格公文的實體結構抽取出來。然後根據表格格線的寬度,將格線去除 而跟格線接觸的文字的形狀仍然被保留下來。我們利用Connect Component的方法將文字切割出來。並利用一統計式的OCR模組來作字元辨 識。最後再用一個常用詞的辭典對辨識結果作矯正。在本論文中亦提出一 套描述表格邏輯結構(logical structure)的方法。目前,系統切字的正 確率是94.45%。我們比對表格公文的正確率,在公文沒有旋轉的情況下 是85%,而有旋轉的情況下80%。 | zh_TW |
dc.language.iso | zh_TW | en_US |
dc.subject | 公文 | zh_TW |
dc.subject | 校園公文 | zh_TW |
dc.subject | 公文處理 | zh_TW |
dc.subject | 字元辨識 | zh_TW |
dc.subject | 文件分析 | zh_TW |
dc.subject | document | en_US |
dc.subject | campus document | en_US |
dc.subject | document processing | en_US |
dc.subject | character recognition | en_US |
dc.subject | document analysis | en_US |
dc.title | 校園公文處理系統的設計 | zh_TW |
dc.title | Design of a Campus Document Processing System | en_US |
dc.type | Thesis | en_US |
dc.contributor.department | 資訊科學與工程研究所 | zh_TW |
Appears in Collections: | Thesis |