標題: 迴歸變數選取之研究
Variable selection methods
作者: 陳民捷
洪慧念
Chen, Min-Chieh
Hung, Hui-Nien
統計學研究所
關鍵字: 變數選取;P大於N;Stochastic search variable selection;Bayesian Lasso;large p and small n;Variable selection;Bayesian Lasso;Stochastic search variable selection
公開日期: 2016
摘要: 變數選取在統計中是一個重要的問題,而在大數據問題中,有一個變數個數p大於樣本個數n的問題,分析在p大於n時會有怎麼樣的問題,本篇論文討論的變數選取從線性模型著手。本論文使用了兩個可以解決這個問題的方法,一個是Bayesian Lasso[Park, T. and Casella, G. 2008 ],這是Lasso的延伸,Lasso在變數挑選中被廣為人知,這方法是Lasso和貝氏函數的結合,另一個方法是Stochastic search variable selection(SSVS)[George; Robert E. McCulloch 1993] ,這個方法是假設了貝氏函數,對於參數估計有了一個先驗分配,再用MCMC對於要估計的參數去抽樣,這兩個方法都在變數個數p大於樣本個數n時可以使用,並且做出不錯的結果,然而,本篇提出了一個截然不同的方法,稱作「分群法」,概念是藉由先進行分群再去挑選變數,將這方法與前面提的兩個方法進行比較分析,討論出這三個方法的優劣。
"Variables selection" is an important question in statistics. In this thesis we compare several existing methods, including Bayesian Lasso [Park, T. and Casella, G. 2008 ] and Stochastic search variable selection SSVS)[George; Robert E. McCulloch 1993]. We also provide a new method called "grouping method". We make comparison in the case of "large p and small n" data set.
URI: http://etd.lib.nctu.edu.tw/cdrfb3/record/nctu/#GT070252608
http://hdl.handle.net/11536/140417
顯示於類別:畢業論文