标题: | 文件分析与文字辨识系统之研究---子计画五:知识导引笔划和部首抽取的改良研究与其在线上手写文字辨识的应用 Knowledge Based Extraction of Strokes and Radicals and Its Application on On-Line Character Recognition |
作者: | 李锡坚 国立交通大学资讯工程学系 |
关键字: | 笔划抽取;字根抽取;知识特征;二阶线上模式;候选字根;最大完整图;Stroke extraction;Radical extraction;Knowledge features;Second order online model;Candidate radical;Maximum clique |
公开日期: | 1995 |
摘要: | 本计画将针对我们原先建立完成的文字辨 识系统作细部的改良以进行对较潦草文字的辨 认.我们的工作可粗分为三部分:笔划抽取的改 良、字根抽取与字根组成文字的改良和将系统 由离线(Off-line)扩充应用在线上(On-line)手写中 文字的辨识.在笔划抽取方面,由于我们设计的 笔划抽取模组条件宽松,以致于除了正确的笔 划之外仍有很多不正确的多余笔划在其中.笔 划数目太多的缘故,使得在字根抽取的过程,速 度与结果均大受影响.我们将利用一些知识特 征(Knowledge-features),在原有的笔划抽取结果中, 去除不正确的笔划,而保留正确的笔划.本计画 也将特别处理圆弧状的曲线.在字根抽取与辨 识方面,我们已定义了约五百个左右的字根来 涵盖所有可能的中文文字,每个字根利用二阶 线上模式(Second-order on-line model)来定义其所含 笔划之种类与笔划间的相互关系,然后利用模 式导引的比对法.本计画将配合一些知识特征, 为每一个输入的文字找到数个较为可靠的候选 字根(Candidate radicals)也将在检验这些候选字根 的合法性,去除一些经知识特征检验不合格者. 剩下的候选字根再利用求最大完整图的求取方 式,指出最佳的组合,而组成中文字.利用我们所 提出的离线文字辨识系统于线上系统使用时, 仅须改写笔划抽取的部分.以线上的方式作输 入,抽取出的笔划数目将可获得很大的改善,配 合原先离线系统的比对方式,再加上线上额外 资讯的辅助,将可完成输入无限制、效果也错 不的线上文字辨识系统. |
官方说明文件#: | NSC84-2221-E009-030 |
URI: | http://hdl.handle.net/11536/96668 https://www.grb.gov.tw/search/planDetail?id=182127&docId=31444 |
显示于类别: | Research Plans |