首页 | 官方网站   微博 | 高级检索  
     

基于支持向量机的兼类文本分类算法研究
引用本文:秦玉平,艾青,王秀坤,李祥纳,刘卫江.基于支持向量机的兼类文本分类算法研究[J].计算机工程与设计,2008,29(2):408-410.
作者姓名:秦玉平  艾青  王秀坤  李祥纳  刘卫江
作者单位:1. 大连理工大学电子与信息工程学院,辽宁,大连,116024;渤海大学信息科学与工程学院,辽宁,锦州,121000
2. 渤海大学信息科学与工程学院,辽宁,锦州,121000
3. 大连理工大学电子与信息工程学院,辽宁,大连,116024
基金项目:国家重点基础研究发展计划(973计划) , 国家自然科学基金
摘    要:针对兼类文本,提出了两种基于支持向量的分类算法.一种是采用1-a-1方法训练子分类器,通过子分类器得到待分类样本的隶属度矩阵,依据隶属度矩阵每行元素和判定该文本所属类别.另一种是采用1-a-r方法训练子分类器,通过子分类器得到待分类样本的隶属度向量,根据隶属度向量判定该文本所属的类别.实验结果表明,这两种算法都具有较好的准确率,召回率和F1值.

关 键 词:支持向量机  隶属度矩阵  隶属度向量  召回率  准确率
文章编号:1000-7024(2008)02-0408-03
收稿时间:2007-01-25
修稿时间:2007年1月25日

Study on multi-subject text classification algorithm based on support vector machines
QIN Yu-ping,AI Qing,WANG Xiu-kun,LI Xiang-na,LIU Wei-jiang.Study on multi-subject text classification algorithm based on support vector machines[J].Computer Engineering and Design,2008,29(2):408-410.
Authors:QIN Yu-ping  AI Qing  WANG Xiu-kun  LI Xiang-na  LIU Wei-jiang
Abstract:For multi-subject text, two classification algorithms based on support vector machines are proposed. The first method uses 1-a-1 to train sub-classifiers, for the samples to be classified, sub-classifiers are used to obtain membership matrix, and then according to the sum of every line of membership matrix, confirms the subjects that the sample belongs to. The second method uses 1-a-r to train sub-classifiers, for the samples to be classified, sub-classifiers are used to obtain the membership vector, according to the membership vector, confirms the subjects that the sample belongs to. The experimental results show that the proposed algorithms have higher performance on precision, recall and F 1 value.
Keywords:support vector machines  membership matrix  membership vector  recall  precision
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号