完整后设资料纪录
DC 栏位语言
dc.contributor.author傅华en_US
dc.contributor.authorFU,HUAen_US
dc.contributor.author李素瑛en_US
dc.contributor.authorLI,SU-YINGen_US
dc.date.accessioned2014-12-12T02:06:38Z-
dc.date.available2014-12-12T02:06:38Z-
dc.date.issued1989en_US
dc.identifier.urihttp://140.113.39.130/cdrfb3/record/nctu/#NT782392041en_US
dc.identifier.urihttp://hdl.handle.net/11536/54443-
dc.description.abstract特征档是文章档的简明表式。搜寻特征档可事先消除大部分不符合要求的文章。因此
,特征档是以耗费较小的额外储存空间,为加速撷取资料的时间以改进传统存取系统
撷取资料之效益。然而由于特征档随原资料库的增长而增长,所以搜寻特征档所需的
时间也相对的提升。因此,若能改进特征档的搜寻方式便可进而提高其效益。
本文中针对特征档提出一种新的架构。此架构可运用在各种型式定型与不定型资料库
中。主要目的在改进搜寻特征档与撷取资料所需的时间。基本上是将原特征档根据在
原档中所有不同且非通常字的出现机率来排序。然后依据排序时所用的数值来建立指
标档。将各个指标指到特征档中相对应的段中。每一段中包含一组记录或文章的特征
。当给定一查询字时,则依据该字的出现机率找出其在指标档中对应的指标。由此指
标得到可能包含该查询字的段组。针对此段组中文章的特征进行搜寻以得到合格的资
料。
在此文中,除了考虑有效率的取出外,对于不定型资料库更加入资料相关性的考虑,
并提供了三种不同的方式。每一种方式配合了一个排名函数,用以按照积分来排列取
出的文章,以便将最符合要求的资料回应给使用者。
此外,我们建立一个数学模式来分析其性能,并经由实验结果验证此方法的优异比之
其他方法有大幅度的改进。此文所提出的方法非常适于变动较少大型资料库。采用此
法可以加快撷取的速度。对于必须变更的资料,则可每隔一段时间以批次作业方式完
成更新。
zh_TW
dc.language.isozh_TWen_US
dc.subject特征档zh_TW
dc.subject新存取方式zh_TW
dc.subject文章档zh_TW
dc.subject不定型资料库zh_TW
dc.subject资料相关性zh_TW
dc.subject批次作业zh_TW
dc.title特征档的新存取方式zh_TW
dc.typeThesisen_US
dc.contributor.department资讯科学与工程研究所zh_TW
显示于类别:Thesis