標題: 文件中文/圖/像的分割及字形切出
作者: 錢崇武
GIAN, CHONG-WU
李錫堅
LI, XI-JIAN
資訊科學與工程研究所
關鍵字: 字形切出;文字;圖形;影像;文件分析系統;光學字元辨識;DOCUMENT-ANALYSIS-SYSTEM;OPTICAL-CHARACTER-READER
公開日期: 1988
摘要: 一張文件典型上包含了文字,圖形和影像,在文件分析系統裡,將文件分割並區分成 文字塊,圖形區和影像區一項必要的步驟,本篇論文提出一個系統,將含有混雜的文 字區,圖形區,影像區的文件,分割和加以區分,並且從文字塊和圖形區裡將文字抽 取出來,而這些文字包含各種不同大小,不同型態的中英文,標點符號及特殊符號, 一開始本系統採用塗黑的方法將相鄰的黑點素連結成一個黑色區域,然後找出黑色區 域的周邊位置,在區分步驟上,本系統利用一些相關的特徵和檢驗方法將那些區域分 成四類:(1)文字列(2)圖形(3)影像(4)線段和雜訊,最後根據投影方式 ,將文字從文字列裡切出,這些文字可以被用在CCR 系統裡做辨認,本系統最後產生 四種輸出型態:(1)文字(2)圖形(3)影像(4)線段和雜訊。
URI: http://140.113.39.130/cdrfb3/record/nctu/#NT772394050
http://hdl.handle.net/11536/53804
Appears in Collections:Thesis