標題: 資料庫中發掘關聯性規則的模型之研究
A Model to Discover Association Rules from Databases
作者: 陳劭穎
Chen, Shao-Ying
黃書淵
Hwang Shu-Yuen
資訊科學與工程研究所
關鍵字: 資料庫知識發掘;關聯性規則;Knowledge Discovery in Databases;Association Rules
公開日期: 1995
摘要: 隨著資料庫應用的普及以及資料量的劇增,如何自資料庫中發掘知識 的研究也日漸重要。以商業上的應用為例,如果我們能在交易資料中發掘 出一些隱含在資料中的訊息,則這些訊息將對未來的決策有相當大的助益 。正因為如此,對於自資料庫中發掘知識的技術,也就成為研究的重點。 基於不同的需求,不同的系統發掘有不同類型的知識。這個模型的主要目 的在於發掘關聯性的知識。 自資料庫中發掘知識的研究之中,由於資 料庫本身的一些特質,使得這方面的研究有其困難點。主要的困難點包括 資料庫的資料量龐大而造成執行速度緩慢,資料庫的值有錯誤,以及資料 庫本身的值不完整等等。為了改進這些缺點,我們提出一個模型以解決這 些問題。 在我們提出的系統架構中,自資料庫中發掘知識的步驟如下 :首先我們將資料庫中數值格式值經由背景知識轉換為符號格式值;其次 再透過資料庫管理系統,將資料庫中的所有值組分為正例以及負例;最後 透過學習以及評估的部份,發掘出符合使用者的興趣的規則。這個系統引 進背景知識,以及包括度與正確度等觀念,以改進前面所說的困難點。 There is growing importance in knowledge discovery in databases (KDD) research driven from rapid generality of database application and explosiveincrease in the amount of data. If we discover the implicit informationin the database, it is helpful in many aspects, for example, decisionmaking. Basing on various requirements, various types of rules are discovered. In this paper we attempt to discover association rules. Three main issues, size of databases, data corruption, and limitedinformation, make knowledge discovery in databases difficult to realize.To improve the efficiency of knowledge discovery, we proposed a model to deal with the a bove problems. In the model we proposed, the steps of knowledge discovery are described as follows. The first step is to translate the values of numericterms into values of symbolic terms. Then we divide the tuples in the training database into positive and negative examples through databasemanagement system (DBMS). Finally er extract interesting rules by executinglearning and evaluation processes. This model imports the notions of background knowledge, coverage and accuracy to deal with the problemsdescribed above.
URI: http://140.113.39.130/cdrfb3/record/nctu/#NT840392035
http://hdl.handle.net/11536/60378
Appears in Collections:Thesis