標題: | 迴歸變數選取之研究 Variable selection methods |
作者: | 陳民捷 洪慧念 Chen, Min-Chieh Hung, Hui-Nien 統計學研究所 |
關鍵字: | 變數選取;P大於N;Stochastic search variable selection;Bayesian Lasso;large p and small n;Variable selection;Bayesian Lasso;Stochastic search variable selection |
公開日期: | 2016 |
摘要: | 變數選取在統計中是一個重要的問題,而在大數據問題中,有一個變數個數p大於樣本個數n的問題,分析在p大於n時會有怎麼樣的問題,本篇論文討論的變數選取從線性模型著手。本論文使用了兩個可以解決這個問題的方法,一個是Bayesian Lasso[Park, T. and Casella, G. 2008 ],這是Lasso的延伸,Lasso在變數挑選中被廣為人知,這方法是Lasso和貝氏函數的結合,另一個方法是Stochastic search variable selection(SSVS)[George; Robert E. McCulloch 1993] ,這個方法是假設了貝氏函數,對於參數估計有了一個先驗分配,再用MCMC對於要估計的參數去抽樣,這兩個方法都在變數個數p大於樣本個數n時可以使用,並且做出不錯的結果,然而,本篇提出了一個截然不同的方法,稱作「分群法」,概念是藉由先進行分群再去挑選變數,將這方法與前面提的兩個方法進行比較分析,討論出這三個方法的優劣。 "Variables selection" is an important question in statistics. In this thesis we compare several existing methods, including Bayesian Lasso [Park, T. and Casella, G. 2008 ] and Stochastic search variable selection SSVS)[George; Robert E. McCulloch 1993]. We also provide a new method called "grouping method". We make comparison in the case of "large p and small n" data set. |
URI: | http://etd.lib.nctu.edu.tw/cdrfb3/record/nctu/#GT070252608 http://hdl.handle.net/11536/140417 |
顯示於類別: | 畢業論文 |