標題: 使用強韌叢集演算法的叢集整合技術
Robust clustering for cluster ensemble
作者: 石耿維
Shih, Keng-Wei
王才沛
Wang, Tsai-Pei
多媒體工程研究所
關鍵字: 強韌叢集;雜訊叢集;模糊;雜訊;叢集整合;robust clustering;noise clustering;fuzzy;noise;outlier;cluster ensemble;possibilistic
公開日期: 2009
摘要: 本論文研究目的在於探討強韌的叢集演算法(robust clustering)應用在叢集整和(cluster ensemble)技術上的分析。叢集整合演算法包括三個主要的部份:1.產生個別分群的叢集演算法、2.將個別分群用一個資料結構來整合各結果、3.如何由這個整合的資料結構來得出最終的分群。第一部份我們將使用強韌叢集演算法(robust clustering)做分群,本論文中將會使用NC(Noise Clustering)及PFCM(Possibilistic Fuzzy c-Means Clustering)作為個別分群的叢集演算法,第二部份我們將使用代表資料點兩兩關係的co-association矩陣來紀錄各個叢集後的結果,第三部份接著再從co-association矩陣中利用階層式叢集演算法(hierarchical agglomerative clustering algorithm)找出最終分群結果並去除雜訊。最終分群的結果好壞會利用NMI(normalized mutual information)做最後分析。測試的資料中我們會用各種資料,包涵高斯、曲線,分析各種叢集演算法後的結果,有雜訊和無雜訊對叢集整合的影響,以及從最後階層樹中分析出最終的分群數目。
In this paper, we discuss using robust clustering for cluster ensembles. Cluster ensemble algorithms include three main parts: (1) Generate clusters by applying different clustering algorithms; (2) combine multiple results as a data structure; (3) find the clustering result from data structure. In the first part, we use robust clustering algorithm to generate multiple clustering results. Robust clustering algorithms used include noise clustering (NC) and possibilistic fuzzy c-means clustering (PFCM). In the second part, we use co-association matrix to organize clusters. In the third part, we discard noises from the co-association matrix and then use hierarchical agglomerative clustering algorithm to find the final cluster. The quality of combination results can be evaluated with normalized mutual information (NMI). The data sets, used for testing include Gaussian and half rings with or without noise.
URI: http://140.113.39.130/cdrfb3/record/nctu/#GT079657532
http://hdl.handle.net/11536/43539
顯示於類別:畢業論文


文件中的檔案:

  1. 753201.pdf

若為 zip 檔案,請下載檔案解壓縮後,用瀏覽器開啟資料夾中的 index.html 瀏覽全文。