標題: 高效率特徵檔文書擷取法之設計與分析
Designing High Performance Text Retrieval Methods Based on Signature File
作者: 楊維邦
交通大學資訊科學研究所
關鍵字: 特徵檔;文書資料庫;文書資料擷取法;Signature file;Textual database;Text retrieval methods
公開日期: 1993
摘要: 在這資訊爆炸的時代,想要快速地取得所需要 參考的資料,電腦文書資料庫系統的幫忙不可或 缺,因而文書資料的擷取法日漸受重視,已成為一 個非常重要的研究課題.在所有的文書資料擷取法中,特徵檔已被公認是 最好的方法之一.特徵檔的基本構想是抽取各文 書檔的一小部份代表性資料存在特徵檔中.在作 文書查詢時,系統先搜尋特徵檔來作過濾工作,如 此,可將一大部分不可能為查詢標的的文書檔濾掉.接下來系統只需在剩下的一小部份文書檔中 作進一步的搜尋,即可找出所需的文書資料.特徵檔的研究大致可分為兩個方向:一是特徵抽 取法的研究;另一是特徵檔儲存結構的研究.前者 主要的目的是希望增加特徵檔的過濾能力,使需 要進一步搜尋的文書檔數量愈少愈好;而後者則 是希望利用好的儲存結構來加快搜尋特徵檔的時 間.這兩個方向雖然都能提高特徵檔的效率,但很 可惜的是,在過去的研究中,這兩個方向都是各自 為政的.假若好的特徵抽取法能有好的儲存結構 與之配合,那麼所產生的方法對文書擷取效率的 改進,必定能比只有單方面的改進大得多.
官方說明文件#: NSC82-0408-E009-044
URI: http://hdl.handle.net/11536/98064
https://www.grb.gov.tw/search/planDetail?id=7956&docId=814
顯示於類別:研究計畫