首页 | 官方网站   微博 | 高级检索  
     

一种基于Tri-training的半监督多标记学习文档分类算法
引用本文:高嘉伟,梁吉业,刘杨磊,李 茹.一种基于Tri-training的半监督多标记学习文档分类算法[J].中文信息学报,2015,29(1):104-110.
作者姓名:高嘉伟  梁吉业  刘杨磊  李 茹
作者单位:1. 山西大学 计算机与信息技术学院,山西 太原 030006;
2. 计算智能与中文信息处理教育部重点实验室,山西 太原 030006
基金项目:国家重点基础研究发展规划(973)前期研究专项(2011CCB311805);国家自然科学基金(61432011,61100058,61202018);山西省科技攻关项目(20110321027-01);山西省科技基础条件平台建设项目(2012091002-0101)
摘    要:多标记学习主要用于解决因单个样本对应多个概念标记而带来的歧义性问题,而半监督多标记学习是近年来多标记学习任务中的一个新的研究方向,它试图综合利用少量的已标记样本和大量的未标记样本来提高学习性能。为了进一步挖掘未标记样本的信息和价值并将其应用于文档多标记分类问题,该文提出了一种基于Tri-training的半监督多标记学习算法(MKSMLT),该算法首先利用k近邻算法扩充已标记样本集,结合Tri-training算法训练分类器,将多标记学习问题转化为标记排序问题。实验表明,该算法能够有效提高文档分类性能。

关 键 词:半监督学习  多标记学习  文档分类  

A Tri-training Based Semi-supervised Multi-label Learning for Text Categorization
GAO Jiawei,LIANG Jiye,LIU Yanglei,LI Ru.A Tri-training Based Semi-supervised Multi-label Learning for Text Categorization[J].Journal of Chinese Information Processing,2015,29(1):104-110.
Authors:GAO Jiawei  LIANG Jiye  LIU Yanglei  LI Ru
Affiliation:1. School of Computer and Information Technology, Shanxi University, Taiyuan, Shanxi 030006, China;
2. Key Laboratory of Computational Intelligence and Chinese Information Processing of Ministry of Education,
Taiyuan, Shanxi 030006,China
Abstract:Multi-label learning is proposed to deal with the ambiguity problem in which a single sample is associated with multiple concept labels simultaneously, while the semi-supervised multi-label learning is a new research direction in recent years. To further exploit the information of unlabeled samples, a semi-supervised multi-label learning algorithm based on Tri-training(MKSMLT) is proposed. It adopts ML-kNN algorithm to get more labeled samples, then employs the Tri-training algorithm to use three classifiers to rank the unlabeled samples. Experimental results illustrate that the proposed algorithm can effectively improve the classification performance.
Keywords:semi-supervised learning  multi-label learning  text categorization  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号