標題: 文件分析與文字辨識系統之研究---子計畫五:知識導引筆劃和部首抽取的改良研究與其在線上手寫文字辨識的應用
Knowledge Based Extraction of Strokes and Radicals and Its Application on On-Line Character Recognition
作者: 李錫堅
國立交通大學資訊工程學系
關鍵字: 筆劃抽取;字根抽取;知識特徵;二階線上模式;候選字根;最大完整圖;Stroke extraction;Radical extraction;Knowledge features;Second order online model;Candidate radical;Maximum clique
公開日期: 1995
摘要: 本計畫將針對我們原先建立完成的文字辨 識系統作細部的改良以進行對較潦草文字的辨 認.我們的工作可粗分為三部分:筆劃抽取的改 良、字根抽取與字根組成文字的改良和將系統 由離線(Off-line)擴充應用在線上(On-line)手寫中 文字的辨識.在筆劃抽取方面,由於我們設計的 筆劃抽取模組條件寬鬆,以致於除了正確的筆 劃之外仍有很多不正確的多餘筆劃在其中.筆 劃數目太多的緣故,使得在字根抽取的過程,速 度與結果均大受影響.我們將利用一些知識特 徵(Knowledge-features),在原有的筆劃抽取結果中, 去除不正確的筆劃,而保留正確的筆劃.本計畫 也將特別處理圓弧狀的曲線.在字根抽取與辨 識方面,我們已定義了約五百個左右的字根來 涵蓋所有可能的中文文字,每個字根利用二階 線上模式(Second-order on-line model)來定義其所含 筆劃之種類與筆劃間的相互關係,然後利用模 式導引的比對法.本計畫將配合一些知識特徵, 為每一個輸入的文字找到數個較為可靠的候選 字根(Candidate radicals)也將在檢驗這些候選字根 的合法性,去除一些經知識特徵檢驗不合格者. 剩下的候選字根再利用求最大完整圖的求取方 式,指出最佳的組合,而組成中文字.利用我們所 提出的離線文字辨識系統于線上系統使用時, 僅須改寫筆劃抽取的部分.以線上的方式作輸 入,抽取出的筆劃數目將可獲得很大的改善,配 合原先離線系統的比對方式,再加上線上額外 資訊的輔助,將可完成輸入無限制、效果也錯 不的線上文字辨識系統.
官方說明文件#: NSC84-2221-E009-030
URI: http://hdl.handle.net/11536/96668
https://www.grb.gov.tw/search/planDetail?id=182127&docId=31444
Appears in Collections:Research Plans