標題: RAS Classifier – 一個適用於生物學資料二元以及多元分類的整合型機器學習網站
RAS Classifier – an integrated machine learning web server applied to binary and multinomial classification of biological data
作者: 葉偉恩
羅惟正
生物科技學系
關鍵字: 機器學習;machine learning
公開日期: 2014
摘要: 我的研究的主要目的是建造一個二元以及多元分類器的網站,可供科學家用來進行各類預測。它具備了簡易,親切的使用介面外,使用者在使用此網站時不需要安裝任何特別的軟體。這個網站提供了幾種不同的機器型學習方法,且各方法都會提供使用者一個簡單易懂、可判斷預測結果可信度的分數。總共有三個機器型學習方法,包括 support vector machine (SVM), random forest (RF) 和 artificial neural network (ANN)。SVM是以LIBSVM這個工具來完成,RF是由以C4.5建構的 decision tree (DT) 為基礎而建造出,ANN則使用了Fast Artificial Neural Network這個函式庫來實作。這幾種機器型學習方法不但可以被單獨使用,也可以合併使用。當使用兩種以上機器型學習方法去預測資料,系統會幫使用者計算最後所得到的結果,且提供預測之可信度供使用者參考。資料格式上,此系統接受三種不同資料格式,讓使用者依個人方便準備原始資料。格式分別是:LIBSVM, C4.5和FANN的檔案資料格式。這三種資料格式不會隨著使用者選擇的建模(training)方法而受影響,使用者不需要自行做格式轉換。
The main goal of this work is to construct a machine learning web server capable of performing binary and multinomial classifications and is well-suited to be applied to the biological researches in which predictions shall be made. This system is named the “RAS classifier”. The web server provides a user-friendly interface. There is no need for users to install any particular software before using the service. In addition, the web server provides three different machine learning methods — random forests (RFs), artificial neural networks (ANNs), and support vector machines (SVMs) — and each of these methods provides a simple score for users to determine the credibility of the prediction. Two datasets are used to assess the performance of the RAS classifier: a circular permutation (CP) site dataset, and a three-dimensional (3D) domain-swapping dataset. The RAS classifier is accessible at http://140.113.15.116/.
URI: http://140.113.39.130/cdrfb3/record/nctu/#GT070157025
http://hdl.handle.net/11536/125685
顯示於類別:畢業論文