首页 | 官方网站   微博 | 高级检索  
     

基于TSVM与主动学习融合的蛋白质交互作用关系抽取
引用本文:刘健苗,王浩畅,赵铁军.基于TSVM与主动学习融合的蛋白质交互作用关系抽取[J].高技术通讯,2009,19(5).
作者姓名:刘健苗  王浩畅  赵铁军
作者单位:1. 哈尔滨工业大学教育部-微软语言语音重点实验室,哈尔滨,150001;中讯邮电咨询设计院有限公司信息工程处,郑州,450007
2. 哈尔滨工业大学教育部-微软语言语音重点实验室,哈尔滨,150001;大庆石油学院计算机与信息技术学院大庆,163318
3. 哈尔滨工业大学教育部-微软语言语音重点实验室,哈尔滨,150001
基金项目:国家高技术研究发展计划(863计划),国家自然科学基金 
摘    要:针对蛋白质交互作用关系(PPI)抽取研究中已标注语料有限而未标注生物医学自由文本易得的问题,进行了基于直推式支持向量机(TSVM)与主动学习融合的蛋白质交互作用关系抽取研究.通过自主选择最优的未标注样本加入到TSVM的训练过程中,最大程度地提高了系统的性能.实验结果表明,TSVM与主动学习融合的算法在少量已标注样本和大量未标注样本组成的混合样本集上取得了较好的学习效果,与传统的支持向量机(SVM)和TSVM算法相比,能有效地减少学习样本数,提高分类精度,在AImed语料上取得了F测度为64.12%的较好性能.

关 键 词:蛋白质交互作用关系抽取  半监督学习  直推式支持向量机(TSVM)  主动学习

Protein-protein interaction extraction based on combining TSVM and active learning
Liu Jianmiao,Wang Haochang,Zhao Tiejun.Protein-protein interaction extraction based on combining TSVM and active learning[J].High Technology Letters,2009,19(5).
Authors:Liu Jianmiao  Wang Haochang  Zhao Tiejun
Affiliation:Liu Jianmiao~(***),Wang Haochang~(****),Zhao Tiejun~*(* MOE-MS Key Laboratory of Natural Language Processing and Speech,Harbin Institute of Technology,Harbin 150001 )( ** Department of Information Engineering,China Information Technology Designing &Consulting Institute Co.,Ltd.,Zhengzhou 450007)(*** College of Computer and Information Technology,Daqing Petroleum Institute,Daqing 163318)
Abstract:This paper presents an algorithm for extraction of protein-protein interaction (PPI) based on the combination of the transductive support vector machine (TSVM) approach with the active learning algorithm to solve the problems which are the lack of labeled corpora and the easy usage of the vast amount of unlabeled biomedical free texts.The algorithm can maximally increase the performance of the TSVM algorithm through actively selecting useful unlabeled samples and adding them to the TSVM training set.The exp...
Keywords:protein-protein interaction extraction  semi-supervised learning  transductive support vector machine(TSVM)  active learning  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号