完整后设资料纪录
DC 栏位 | 值 | 语言 |
---|---|---|
dc.contributor.author | 傅华 | en_US |
dc.contributor.author | FU,HUA | en_US |
dc.contributor.author | 李素瑛 | en_US |
dc.contributor.author | LI,SU-YING | en_US |
dc.date.accessioned | 2014-12-12T02:06:38Z | - |
dc.date.available | 2014-12-12T02:06:38Z | - |
dc.date.issued | 1989 | en_US |
dc.identifier.uri | http://140.113.39.130/cdrfb3/record/nctu/#NT782392041 | en_US |
dc.identifier.uri | http://hdl.handle.net/11536/54443 | - |
dc.description.abstract | 特征档是文章档的简明表式。搜寻特征档可事先消除大部分不符合要求的文章。因此 ,特征档是以耗费较小的额外储存空间,为加速撷取资料的时间以改进传统存取系统 撷取资料之效益。然而由于特征档随原资料库的增长而增长,所以搜寻特征档所需的 时间也相对的提升。因此,若能改进特征档的搜寻方式便可进而提高其效益。 本文中针对特征档提出一种新的架构。此架构可运用在各种型式定型与不定型资料库 中。主要目的在改进搜寻特征档与撷取资料所需的时间。基本上是将原特征档根据在 原档中所有不同且非通常字的出现机率来排序。然后依据排序时所用的数值来建立指 标档。将各个指标指到特征档中相对应的段中。每一段中包含一组记录或文章的特征 。当给定一查询字时,则依据该字的出现机率找出其在指标档中对应的指标。由此指 标得到可能包含该查询字的段组。针对此段组中文章的特征进行搜寻以得到合格的资 料。 在此文中,除了考虑有效率的取出外,对于不定型资料库更加入资料相关性的考虑, 并提供了三种不同的方式。每一种方式配合了一个排名函数,用以按照积分来排列取 出的文章,以便将最符合要求的资料回应给使用者。 此外,我们建立一个数学模式来分析其性能,并经由实验结果验证此方法的优异比之 其他方法有大幅度的改进。此文所提出的方法非常适于变动较少大型资料库。采用此 法可以加快撷取的速度。对于必须变更的资料,则可每隔一段时间以批次作业方式完 成更新。 | zh_TW |
dc.language.iso | zh_TW | en_US |
dc.subject | 特征档 | zh_TW |
dc.subject | 新存取方式 | zh_TW |
dc.subject | 文章档 | zh_TW |
dc.subject | 不定型资料库 | zh_TW |
dc.subject | 资料相关性 | zh_TW |
dc.subject | 批次作业 | zh_TW |
dc.title | 特征档的新存取方式 | zh_TW |
dc.type | Thesis | en_US |
dc.contributor.department | 资讯科学与工程研究所 | zh_TW |
显示于类别: | Thesis |