标题: RAS Classifier – 一个适用于生物学资料二元以及多元分类的整合型机器学习网站
RAS Classifier – an integrated machine learning web server applied to binary and multinomial classification of biological data
作者: 叶伟恩
罗惟正
生物科技学系
关键字: 机器学习;machine learning
公开日期: 2014
摘要: 我的研究的主要目的是建造一个二元以及多元分类器的网站,可供科学家用来进行各类预测。它具备了简易,亲切的使用介面外,使用者在使用此网站时不需要安装任何特别的软体。这个网站提供了几种不同的机器型学习方法,且各方法都会提供使用者一个简单易懂、可判断预测结果可信度的分数。总共有三个机器型学习方法,包括 support vector machine (SVM), random forest (RF) 和 artificial neural network (ANN)。SVM是以LIBSVM这个工具来完成,RF是由以C4.5建构的 decision tree (DT) 为基础而建造出,ANN则使用了Fast Artificial Neural Network这个函式库来实作。这几种机器型学习方法不但可以被单独使用,也可以合并使用。当使用两种以上机器型学习方法去预测资料,系统会帮使用者计算最后所得到的结果,且提供预测之可信度供使用者参考。资料格式上,此系统接受三种不同资料格式,让使用者依个人方便准备原始资料。格式分别是:LIBSVM, C4.5和FANN的档案资料格式。这三种资料格式不会随着使用者选择的建模(training)方法而受影响,使用者不需要自行做格式转换。
The main goal of this work is to construct a machine learning web server capable of performing binary and multinomial classifications and is well-suited to be applied to the biological researches in which predictions shall be made. This system is named the “RAS classifier”. The web server provides a user-friendly interface. There is no need for users to install any particular software before using the service. In addition, the web server provides three different machine learning methods — random forests (RFs), artificial neural networks (ANNs), and support vector machines (SVMs) — and each of these methods provides a simple score for users to determine the credibility of the prediction. Two datasets are used to assess the performance of the RAS classifier: a circular permutation (CP) site dataset, and a three-dimensional (3D) domain-swapping dataset. The RAS classifier is accessible at http://140.113.15.116/.
URI: http://140.113.39.130/cdrfb3/record/nctu/#GT070157025
http://hdl.handle.net/11536/125685
显示于类别:Thesis