完整後設資料紀錄
DC 欄位 | 值 | 語言 |
---|---|---|
dc.contributor.author | 許文瑞 | en_US |
dc.contributor.author | Xu, Wen-Rui | en_US |
dc.contributor.author | 李錫堅 | en_US |
dc.contributor.author | Li, Xi-Jian | en_US |
dc.date.accessioned | 2014-12-12T02:16:21Z | - |
dc.date.available | 2014-12-12T02:16:21Z | - |
dc.date.issued | 1995 | en_US |
dc.identifier.uri | http://140.113.39.130/cdrfb3/record/nctu/#NT844392004 | en_US |
dc.identifier.uri | http://hdl.handle.net/11536/61194 | - |
dc.description.abstract | 本論文是介紹在固定表格手寫中文字切割的方法。在論文的第一個部份,我們將介紹 三個關於手寫中文字切割的方法,分別是投影(projection operation)、相連元件 抽取(connected component extraction)和最短路徑切割(short path cutting) 。為了要有效率的抽字,我們使用水平和垂直投影來抽取文件上的中文字。第一次的 水平投影是用來決定一個欄位有多少列的字,如果在最欄位的最高級最低的現有超過 一定量的點數,我們就會考慮欄位外的黑點。接著的垂直投影是為了將字分開,如果 有兩個元件比較近,我們就將之合成一個字。最後的水平投影是為了找出字超出格現 外的部份。因為格線的座標已知,我們直接將格線去除。然而有些初切的字組其寬度 比平均寬度大,我們使用相連元件來抽取。而有些字可能還連在一起,我們便使用最 短路竟的方法來切割比平均寬度的1.5倍大的字組區塊。 在論文的第二部份,統計式的辨認模組來辨識所有從文件中抽出的中文字。因為數字 的寬度比較小,所以會被合成一個中文字,當這些誤抽的區塊輸入時,辨認模組將會 根據他們的差異性(difference)而拒認。我們系統的抽出率可達89.40%而系統的 辨識率則是55.23%。 | zh_TW |
dc.language.iso | zh_TW | en_US |
dc.subject | 投影 | zh_TW |
dc.subject | 相連元件抽取 | zh_TW |
dc.subject | 最短路徑切割 | zh_TW |
dc.subject | 水平投影 | zh_TW |
dc.subject | 表格 | zh_TW |
dc.subject | 手寫中文 | zh_TW |
dc.subject | 資訊 | zh_TW |
dc.subject | 電腦科學 | zh_TW |
dc.subject | Form Documents | en_US |
dc.subject | Segmentation | en_US |
dc.subject | Handwritten Character | en_US |
dc.subject | INFORAMTION | en_US |
dc.subject | COMPUTER-SCIENCE | en_US |
dc.title | 固定表格手中寫中文之切割 | zh_TW |
dc.title | Handwritten Character Segmentation in Form Documents with Known Structure | en_US |
dc.type | Thesis | en_US |
dc.contributor.department | 資訊科學與工程研究所 | zh_TW |
顯示於類別: | 畢業論文 |