基于主动数据选取的半监督聚类算法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于主动数据选取的半监督聚类算法

作者姓名：	文平冷明伟陈晓云

作者单位：	1. 兰州大学信息科学与工程学院,兰州,730000 2. 兰州大学信息科学与工程学院,兰州730000;上饶师范学院数学与计算机学院,江西上饶334001

基金项目：	江西省教育厅科技课题资助项目（GJJ11609）

摘要：	利用少量标签数据获得较高聚类精度的半监督聚类技术是近年来数据挖掘和机器学习领域的研究热点。但是现有的半监督聚类算法在处理极少量标签数据和多密度不平衡数据集时的聚类精度比较低。基于主动学习技术研究标签数据选取,提出了一个新的半监督聚类算法。该算法结合最小生成树聚类和主动学习思想,选取包含信息较多的数据点作为标签数据,使用类KNN思想对类标签进行传播。通过在UCI标准数据集和模拟数据集上的测试,结果表明提出的算法比其他算法在处理多密度、不平衡数据集时有更高精度且稳定的聚类结果。
关键词：	数据挖掘半监督聚类主动学习标签数据数据选取最小生成树多密度数据集不平衡数据集
本文献已被 CNKI 万方数据等数据库收录！
	点击此处可从《计算机应用研究》浏览原始摘要信息
	点击此处可从《计算机应用研究》下载全文