首页 | 官方网站   微博 | 高级检索  
     

一种基于信息熵的混合属性数据谱聚类算法
引用本文:姜智涵.一种基于信息熵的混合属性数据谱聚类算法[J].计算机应用研究,2019,36(8).
作者姓名:姜智涵
作者单位:中国科学院沈阳自动化研究所
基金项目:工信部智能制造综合标准化与新模式应用项目(Y6L8283A01)
摘    要:针对传统的聚类算法只能处理单属性的数据,不能很好地处理混合属性数据的聚类问题,以及目前大多数混合属性数据聚类算法对初始化敏感、不能处理任意形状的数据的问题,提出一种基于信息熵的混合属性数据谱聚类算法,用于处理混合类型数据。首先,提出了一种新的相似性度量方式,利用谱聚类算法中的数值型数据构成的高斯核函数矩阵与新的基于信息熵的分类型数据构成的影响因子矩阵相结合代替了传统的相似度矩阵,新的相似度矩阵避免了数值属性与分类属性数据之间的转换和参数调整;然后,把新的相似度矩阵运用到谱聚类算法中,以便于处理任意形状的数据,最终得出聚类结果。通过在UCI的数据集上的实验表明,该算法能有效地处理混合属性数据的聚类问题,且具有较高的稳定性以及良好的鲁棒性。

关 键 词:混合属性数据  谱聚类  高斯核函数  影响因子
收稿时间:2018/2/1 0:00:00
修稿时间:2018/3/24 0:00:00

Entropy-based spectral clustering algorithm for mixed type data
jiangzhihan.Entropy-based spectral clustering algorithm for mixed type data[J].Application Research of Computers,2019,36(8).
Authors:jiangzhihan
Affiliation:Shenyang Institute of Automation Chinese Academy of Sciences
Abstract:
Keywords:mixed type data  spectral clustering  Gaussian kernel function  influence factor
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号