首页 | 官方网站   微博 | 高级检索  
     

基于最佳样本标记的主动支持向量机学习策略
引用本文:胡正平.基于最佳样本标记的主动支持向量机学习策略[J].信号处理,2008,24(1):105-107.
作者姓名:胡正平
作者单位:燕山大学通信电子工程系,秦皇岛,066004;哈尔滨工业大学信息工程系图像信息处理研究所,哈尔滨,150001
摘    要:支持向量机通过随机选择标记的训练样本进行有监督学习,随着信息容量的增加和数据收集能力的提高,这需要耗费大量的标记工作量,给实际应用带来不少困难.本文提出了基于最佳样本标记的主动支持向量机学习策略:首先利用无监督聚类选择一个小规模的样本集进行标记,然后训练该标记样本集得到一个初始SVM分类器,然后利用该分类器主动选择最感兴趣的无标记样本进行标记,逐渐增加标记样本的数量,并在此基础上更新分类器,反复进行直到得到最佳性能的分类器.实验结果表明在基本不影响分类精度的情况下,主动学习选择的标记样本数量大大低于随机选择的标记样本数量,这大大降低了标记的工作量,而且训练速度同样有所提高.

关 键 词:主动学习  核函数  支持向量机  被动学习  无监督聚类  最佳  样本数量  支持向量机  学习策略  Data  Selection  Optimal  Learning  Strategy  训练速度  随机选择  主动学习  情况  分类精度  影响  结果  实验  性能  加标记  无标记  主动选择
修稿时间:2005年9月6日

An Active Learning Strategy of SVM Via Optimal Selection of Labeled Data
HU Zheng-ping.An Active Learning Strategy of SVM Via Optimal Selection of Labeled Data[J].Signal Processing,2008,24(1):105-107.
Authors:HU Zheng-ping
Abstract:Support Vector machine is an effective supervised learning classifier by random selecting labeled samples,however it need label large-scale samples in actual large data application by manual works.This paper describes a active learning strategy for SVM. The learning strategy is motivated by the statistical query model and unsupervised clustering method.First the initial classifier with a small training set selected by unsupervised clustering operation,then prune the large training set with the initial classifier to query the in- formative unlabeled samples and add them into labeled set.New labeled set is used to update the classifier again and again until gain the expectation classifier performance.The experimental results show that the active SVM learning strategy provides the same accurate classifi- cation performance as the passive SVM classifier obtained by training large labeled set directly while minimizing the labeling effort.
Keywords:active learning  kernel function  support vector machine  passive learning  unsupervised clustering
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号