標題: 貝氏無母數多重標記資料分群法
Bayesian Nonparametric Multi-Label Clustering
作者: 周載敏
Jou, Tzai-Min
李嘉晃
劉建良
資訊科學與工程研究所
關鍵字: 貝氏無母數;多重標記;Bayesian Nonparametric;Multi-Label
公開日期: 2014
摘要:   近年來多重標記資料的使用愈來愈廣泛,許多既有的學習方法是將資料分入多個類別,但是至今仍然尚未存在能將資料分到多個群的學習演算法。而本論文所提出的“貝氏無母數多重標記資料分群法”則是第一個用來分群多重標記資料的演算法,除了演算法之外,在論文中也提出一種新的評估多重標記資料分群結果的方法。演算法中使用無母數模型來預測資料所屬於的多個群別,此模型的優點是能夠根據資料的特性適時調整資料群的數量。論文所提的方法不像既有的分類方法必須事先給予固定的類別數量才能預測資料的分類結果。因此,無母數模型相對於其他模型而言,讓提出的演算法在學習的過程中具有了成長的彈性空間。   本論文的另一項貢獻是提出多重標記分群方法的結果評估方式,由於傳統多重標記資料分類方法所使用的評估方式是假設類別為固定的,因此既有的評估方式並不適用於本論文所提出的分群方法。在最後的實驗結果顯示本論文的分群方法在大部分的資料集都能贏過既有的分類方法,由於分群方法並無給予任何的標記資料,使得此演算法能夠適用的範疇更加廣泛,未來還會繼續探討如何從多重標記資料中取得更適合的資訊來改進目前的演算法。
Multi-label learning problem has attracted a lot of attention in recent years, but most of the algorithms focus on classification problem. This paper proposes the first method to solve multi-label clustering problem. Based on the multi-label clustering concept, this paper uses Bayesian nonparametric model to predict the multi-label data sets. The advantage of the model is to let the model grow by itself. Another contribution of this paper is to create a new evaluation method for multi-label clustering problem. Because the existing multi-label classification methods assume the number of classes is fixed, so the evaluation methods use in classification problem is not suitable in clustering result. And the experiments show that the proposed method can perform better than other methods.
URI: http://140.113.39.130/cdrfb3/record/nctu/#GT070156017
http://hdl.handle.net/11536/75672
顯示於類別:畢業論文