面向密度分布不均数据的加权逆近邻密度峰值聚类算法 |
| |
引用本文: | 吕莉,陈威,肖人彬,韩龙哲,谭德坤.面向密度分布不均数据的加权逆近邻密度峰值聚类算法[J].智能系统学报,2024(1):165-175. |
| |
作者姓名: | 吕莉 陈威 肖人彬 韩龙哲 谭德坤 |
| |
作者单位: | 1. 南昌工程学院信息工程学院;2. 南昌工程学院南昌市智慧城市物联感知与协同计算重点实验室;3. 华中科技大学人工智能与自动化学院 |
| |
基金项目: | 国家自然科学基金项目(62066030);;江西省教育厅科技项目(GJJ190958); |
| |
摘 要: | 针对密度分布不均数据,密度峰值聚类算法易忽略类簇间样本的疏密差异,导致误选类簇中心;分配策略易将稀疏区域的样本误分到密集区域,导致聚类效果不佳的问题,本文提出一种面向密度分布不均数据的加权逆近邻密度峰值聚类算法。该算法首先在局部密度公式中引入基于sigmoid函数的权重系数,增加稀疏区域样本的权重,结合逆近邻思想,重新定义了样本的局部密度,有效提升类簇中心的识别率;其次,引入改进的样本相似度策略,利用样本间的逆近邻及共享逆近邻信息,使得同一类簇样本间具有较高的相似度,可有效改善稀疏区域样本分配错误的问题。在密度分布不均、复杂形态和UCI数据集上的对比实验表明,本文算法的聚类效果优于IDPC-FA、FNDPC、FKNN-DPC、DPC和DPCSA算法。
|
关 键 词: | 密度峰值聚类 密度分布不均 逆近邻 共享逆近邻 样本相似度 局部密度 分配策略 数据挖掘 |
|