基于拉普拉斯回归主动学习的大数据流分类算法 |
| |
引用本文: | 杜恒,杨俊成.基于拉普拉斯回归主动学习的大数据流分类算法[J].计算机应用与软件,2019,36(12). |
| |
作者姓名: | 杜恒 杨俊成 |
| |
作者单位: | 河南工业职业技术学院电子信息工程学院 河南 南阳473000 |
| |
基金项目: | 教育部"云数融合 科教创新"基金项目;河南省高等学校青年骨干教师培养计划基金项目 |
| |
摘 要: | 实时数据流中标记样本所占比例较小,并且存在大量的噪声数据和冗余数据,导致数据流的实时分类准确率较低。针对这种情况,提出基于拉普拉斯回归主动学习的大数据流分类算法。为分类器设计相对支持度差异函数作为分类的决策方法,通过阈值判断当前数据流的标记样本量。设计基于约束规则的半监督主动学习算法,从无标记样本集选择信息量最丰富的样本。采用拉普拉斯正则最小二乘回归模型作为半监督学习的回归模型,迭代地扩展数据流的标记样本量。仿真结果表明,该算法有效地提高了数据流的分类准确率,并且满足实时性的需求。
|
关 键 词: | 大数据 实时数据流 拉普拉斯正则最小二乘 分类算法 半监督学习 主动学习 |
CLASSIFICATION ALGORITHM FOR BIG DATA STREAM BASED ON LAPLACIAN REGULARIZED REGRESSION ACTIVE LEARNING |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
|