首页 | 官方网站   微博 | 高级检索  
     

基于支持向量机的蛋白质名称信息提取技术研究
引用本文:姜涛,潘泉,张绍武.基于支持向量机的蛋白质名称信息提取技术研究[J].计算机测量与控制,2006,14(11):1521-1523.
作者姓名:姜涛  潘泉  张绍武
作者单位:1. 西北工业大学,自动化学院,陕西,西安,710072
2. 西北工业大学,生命科学院,陕西,西安,710072
摘    要:基于信息提取理论,采取支持向量机和K近邻两种机器学习方法,对生物医学文献中蛋白质名称提取问题进行了相关研究;结果表明,机器学习方法可以较精确地标示出文章中的蛋白质名称,以支持向量机的效果最好,精度达到70.2%,召回率达到60.4%;文章还对文本的特征组合进行了比较研究。

关 键 词:信息提取  蛋白质  支持向量机  K近邻
文章编号:1671-4598(2006)11-1521-03
收稿时间:2006-03-20
修稿时间:2006-04-24

Support Vector Machines for Extracting Protein Name Information from Biomedical Literature
Jiang Tao,Pan Quan,Zhang Shaowu.Support Vector Machines for Extracting Protein Name Information from Biomedical Literature[J].Computer Measurement & Control,2006,14(11):1521-1523.
Authors:Jiang Tao  Pan Quan  Zhang Shaowu
Abstract:Based on information extraction, support vector machines and K-NN were used for protein name extraction from biomedical literatures. The results show that SVM has better performance than K-NN. The precision and recall of SVM are 70.2%, 60.4% respectively. The SVM performance by comparing different combination of features was also discussed.
Keywords:information extraction  protein  support vector machines  K- NN
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号