首页 | 官方网站   微博 | 高级检索  
     

类别不平衡的分类方法及在生物信息学中的应用
引用本文:邹权,郭茂祖,刘扬,王峻. 类别不平衡的分类方法及在生物信息学中的应用[J]. 计算机研究与发展, 2010, 47(8)
作者姓名:邹权  郭茂祖  刘扬  王峻
作者单位:哈尔滨工业大学计算机科学与技术学院,哈尔滨,150001
基金项目:国家自然科学基金,黑龙江省杰出青年科学基金,黑龙江省自然科学基金重点项目 
摘    要:提出一种处理正反例不平衡的分类方法,以解决生物信息学中的snoRNA识别、microRNA前体判别、SNP位点的真伪识别等问题. 利用集成学习的思想,将反例集均匀分割并依次与正例集组合,得到一组类别平衡的训练集.然后对每个训练集采用不同原理的分类器进行训练,最后投票表决待测样本.为了避免弱分类器影响投票效果,结合AdaBoost思想,将每个分类器训练中产生的错误样本加入到下2个分类器的训练集中,既避免了AdaBoost的反复训练,又有效地利用投票机制遏制了弱分类器的影响.5组UCI测试数据和3组生物信息学实验证明了它在处理类别不平衡分类问题时的优越性.

关 键 词:生物信息学  类别不平衡  非编码RNA识别  SNP位点鉴别  分类

A Classification Method for Class-Imbalanced Data and Its Application on Bioinformatics
Zou Quan,Guo Maozu,Liu Yang,Wang Jun. A Classification Method for Class-Imbalanced Data and Its Application on Bioinformatics[J]. Journal of Computer Research and Development, 2010, 47(8)
Authors:Zou Quan  Guo Maozu  Liu Yang  Wang Jun
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号