首页 | 官方网站   微博 | 高级检索  
     

基于熵的混合属性聚类算法
引用本文:邱保志,王志林.基于熵的混合属性聚类算法[J].计算机工程与设计,2021,42(4):957-962.
作者姓名:邱保志  王志林
作者单位:郑州大学信息工程学院,河南郑州450001
摘    要:为解决混合属性中数值属性与分类属性相似性度量的差异造成的聚类效果不佳问题,分析混合属性聚类相似性度量的问题,提出基于熵的混合属性聚类算法.引入熵离散化技术将数值属性离散化,仅使用二元化距离度量混合属性对象之间的相似性,在聚类过程中随机选取k个初始簇中心,将其它对象按照距离k个簇中心的最小距离划分到相应的簇中,选择每个簇中每个数据属性中频率最高的属性值形成新的簇中心继续划分对象,迭代此步当满足目标条件时停止,形成最终聚类.在UCI数据集上的实验结果验证了该算法的有效性.

关 键 词:聚类  混合属性    离散化  

Entropy-based clustering algorithm for mixed attribute
QIU Bao-zhi,WANG Zhi-lin.Entropy-based clustering algorithm for mixed attribute[J].Computer Engineering and Design,2021,42(4):957-962.
Authors:QIU Bao-zhi  WANG Zhi-lin
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号