首页 | 官方网站   微博 | 高级检索  
     

基于拉普拉斯回归主动学习的大数据流分类算法
引用本文:杜恒,杨俊成.基于拉普拉斯回归主动学习的大数据流分类算法[J].计算机应用与软件,2019,36(12).
作者姓名:杜恒  杨俊成
作者单位:河南工业职业技术学院电子信息工程学院 河南 南阳473000
基金项目:教育部"云数融合 科教创新"基金项目;河南省高等学校青年骨干教师培养计划基金项目
摘    要:实时数据流中标记样本所占比例较小,并且存在大量的噪声数据和冗余数据,导致数据流的实时分类准确率较低。针对这种情况,提出基于拉普拉斯回归主动学习的大数据流分类算法。为分类器设计相对支持度差异函数作为分类的决策方法,通过阈值判断当前数据流的标记样本量。设计基于约束规则的半监督主动学习算法,从无标记样本集选择信息量最丰富的样本。采用拉普拉斯正则最小二乘回归模型作为半监督学习的回归模型,迭代地扩展数据流的标记样本量。仿真结果表明,该算法有效地提高了数据流的分类准确率,并且满足实时性的需求。

关 键 词:大数据  实时数据流  拉普拉斯正则最小二乘  分类算法  半监督学习  主动学习

CLASSIFICATION ALGORITHM FOR BIG DATA STREAM BASED ON LAPLACIAN REGULARIZED REGRESSION ACTIVE LEARNING
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号