首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于图划分的网状高阶异构数据联合聚类算法   总被引:1,自引:0,他引:1  
目前已有的高阶联合聚类算法主要集中于分析星型高阶异构数据,然而实际应用中,存在大量网状高阶异构数据。为了有效挖掘网状高阶异构数据内部隐藏的结构,本文提出一种基于图划分的高阶联合聚类算法(简称为GPHCC),该算法将网状高阶异构数据的聚类问题转化为多对二部图的最小正则割划分问题。为了降低计算复杂度,将此优化问题转化为半正定问题求解。实验结果表明GPHCC算法优于目前已有的5种二阶联合聚类算法和5种高阶联合聚类算法。  相似文献   

2.
提出一种基于稀疏分解的l0构图法,通过稀疏分解系数矩阵得到图中邻接矩阵和边的权重。将l0构图法应用到局部全局一致性学习(Learning with Local and Global Consistency,LLGC)算法中,并通过K-均值聚类优化稀疏分解所需字典,以降低计算复杂度。在8个UCI数据集上的实验表明,与经典LLGC算法相比,新算法能在消耗时间不增加的情况下提高分类精度,提升算法性能。  相似文献   

3.
针对密度聚类算法无法应用于大规模数据集的问题,提出一种基于划分网格的密度聚类算法(GDSCAN)。将大规模二维点阵图划分为若干网格,网格最短边不小于给定邻域半径,目标点所在网格中任意点的邻域范围不会超过与该网格直接连接的网格,只需在保留网格内寻找邻域点,从而减少计算量;聚类从任意无类别核心点开始,将该点的所有密度可达组成一个簇,以此类推直至所有核心点都有类别;采用提出的GDSCAN算法对不同数量级的二维路网节点进行聚类验证。结果表明,GDSCAN算法可有效解决大规模二维点阵数据集中密度聚类的效率问题,数据量越大,效果越明显,且时间复杂度明显降低。  相似文献   

4.
基于数据驱动的电容式电压互感器(Capacitor Voltage Transformer,CVT)误差状态预测技术面临着数据不平衡,小样本数据不足的困境。针对该问题,整合DBSCAN聚类算法和基于径向的过采样算法(Radial-Based Oversampling,RBO),并在此基础上提出了一种引入权重分布RBO的过采样算法(Weight Distribution and Radial-Based Oversampling,WD-RBO)。该算法首先使用DBSCAN对CVT超差样本聚类,过滤数据集中的噪声;其次,通过簇密度分布函数和质心势能,计算超差样本各个簇的采样权重,确定每个簇中合成新样本的数量;最后,使用改进的RBO过采样算法合成新超差样本。实验结果表明,与SMOTE和RBO等过采样算法相比,WD-RBO使得预测模型的准确率和AUC值分别提高到0.967和0.996,且运行时长满足应用要求。WD-RBO可以有效解决类间不平衡和类内不平衡,提高模型对CVT误差状态的预测性能。  相似文献   

5.
采用属性聚类的高维子空间聚类算法   总被引:4,自引:1,他引:3  
为了解决现有子空间聚类算法时间复杂度偏高以及对输入参数敏感的问题,提出了一种基于属性聚类方法的高效子空间聚类算法.算法首先通过计算每个属性的基尼值来过滤冗余属性,而后通过基于二维联合基尼值的关系函数建立非冗余属性的关系矩阵,以衡量任意两个非冗余属性的相关度, 进而在关系矩阵上应用可产生交叠的聚类算法,聚类结果即为所有兴趣度子空间的候选集合,最后调用聚类算法得到所有存在于这些子空间内的簇.在人工数据集和真实数据集上的实验表明,新算法不仅在时间复杂度和子空间簇的寻找能力方面均有较优表现,而且对输入参数的取值不甚敏感.  相似文献   

6.
空间域减法聚类粒子滤波算法   总被引:1,自引:1,他引:0  
针对粒子滤波计算复杂度高的问题,为降低滤波中所需的样本数目,提出了一种基于减法聚类的粒子滤波算法,算法将样本及对应权重进行映射构成聚类向量,在设定的聚类半径下,采用改进的减法聚类算法对向量进行分类,得到若干在空间中分离的子类中心,然后用子类中心代替整个向量集,并利用产生的新向量集重构样本集和权重.仿真实验表明该算法在保持了粒子滤波估计精度的同时,有效降低了样本数目,提高了计算效率.  相似文献   

7.
提出了一种改进的基于粒子群优化的快速K均值算法,有效克服了K均值算法对初始聚类中心敏感和容易陷入局部最优从而影响聚类效果等缺点.与已有的粒子群优化聚类算法相比,该算法通过对样本各维属性进行规范化,预先计算样本的相异度矩阵,提出了一种简化的粒子的编码规则,基于相异度矩阵进行粒子群优化K均值聚类,在保证聚类效果的基础上,有效降低了计算的复杂度.在多个UCI数据集上的实验结果表明,该算法是有效的。  相似文献   

8.
提出了一种融合颜色、亮度、空间距离和纹理等特征的彩色结肠镜图像分割新算法.纹理特征采用一组Gabor滤波器对原始图像滤波后计算得到的分形维特征.利用基于元素问相似性的随机聚类方法对特征空间进行聚类.通过对图中的切割进行采样,自动获得最佳的类别数目,算法复杂度较低,其随机特性使得它具有抗噪声的鲁棒性.对多幅结肠镜图像进行分割实验,结果证实了该算法的有效性.  相似文献   

9.
为了有效利用少量先验信息提高多视角数据聚类效果,提出了一种基于距离度量学习的半监督多视角谱聚类算法(简称ML-SMC)。首先,利用距离度量学习引入先验信息,将多视角数据映射到反映先验约束条件的空间.然后,根据相似性构造每个视角的视图,将多视角聚类问题转化为最小正则割的图划分问题。实验结果表明:ML-SMC算法聚类结果的精度优于3种经典的多视角聚类算法和4种半监督单视角聚类算法。并且通过利用少量先验信息ML-SMC算法能够有效提高聚类效果。  相似文献   

10.
已有研究基于子图交互关系构造子图网络来实现网络结构增强,然而其算法复杂度高.鉴于此,基于不同阶子图网络的拓扑属性分别对原始网络进行赋权,得到一阶和二阶加权网络,以权重的形式直观体现子图交互关系.同时,这两种加权网络的权重可以直接通过原始网络的拓扑结构计算得出,从而避免了子图网络的构造过程,大大降低了算法复杂度.最后,以...  相似文献   

11.
为了解决现有子空间聚类算法时间复杂度偏高和对输入参数敏感的问题,提出了一种基于联合熵矩阵的子空间聚类算法. 通过计算每个属性实例分布的熵降维,计算任意两个维度的联合熵,形成联合熵矩阵,在联合熵矩阵中搜索最高阶全1子矩阵作为兴趣子空间,最后在兴趣子空间完成聚类. 在人工数据集和公开数据集上的实验表明,与传统子空间聚类算法相比,新算法能以较低的开销识别维度更高的兴趣度子空间.  相似文献   

12.
提出了一种利用二维熵分量的K均值攻击效果聚类评估方法. 利用网络熵预处理攻击数据集,将效果数据映射到二维平面,并以二维熵分量作为聚类的输入,然后基于K均值算法建立聚类数据集与效果分类之间的关系,实现了对网络攻击效果结果集的明确划分,并提供快速有效的评估结果. 仿真实验结果证明,该方法能高效正确地处理攻击数据,并以评估结果类图的形式提供直观的评估结果.  相似文献   

13.
现有的标注聚类算法大多采用传统的K-means或Single-linkage算法对标注数据直接聚类,但是K-means或Sin-gle-linkage本身固有的缺陷严重影响了聚类结果的质量.给出了一种局部中心度传播聚类算法LCIPC(local centrality in-formation passing clustering),该算法首先在标注相似度的基础上建立标注数据的KNN有向邻居图G;然后利用核密度估计方法计算每个标注的局部中心度;再通过随机游走方法在图G中传播局部中心度,以产生全局中心度等级;最后,调用图深度优先搜索算法发现标注聚类结果.在3个真实数据集上的聚类结果显示,LCIPC算法具有够获得高质量标注聚类结果的能力.  相似文献   

14.
针对传统单类学习模型对多模态或多密度分布数据描述能力不足的问题,将集成聚类和聚类稳定性分析引入单类学习.首先将确定聚类簇个数与确定聚类簇分布统一到同一个增强单类学习框架中,之后各聚类簇互为正负类分别建起立多个单类分类模型,最后采用最大融合体积方法融合其决策边界.以经典的支持向量数据描述(SVDD)为例,设计了基于集成聚类的稳定支持向量数据描述算法——ECS-SVDD.在标准UCI数据集和一个真实恶意程序行为数据集上的实验结果表明,ECS-SVDD的性能较单个支持向量数据描述及同类单类学习方法更优.该方法可直接推广到其他最小包含体积集合类型的单类学习算法上,以增强单类学习算法处理多模态和多密度分布数据的能力.  相似文献   

15.
研究了节点聚类系数与网络社区结构之间的关系.直接使用节点聚类系数不易刻画社区子图的高聚集特性,定义了一些基于节点聚类系数的社区度量,据此识别网络中的社区.首先,给出了基于聚类系数增大的社区间边判定规则,简称CCE规则;然后,利用CCE规则引出相似度矩阵,即网络密度矩阵;最后,通过网络密度矩阵来构造Laplacian矩阵,并进一步推导出通过计算Laplacian矩阵的特征值以及特征向量来实现社区结构划分的算法.三个真实网络数据的实验结果表明,算法不仅获得了令人满意的划分结果,而且还提高了算法的时间效率.  相似文献   

16.
基于相似性的点模型简化算法   总被引:1,自引:0,他引:1  
为了获得高质量的简化点模型,提出了一种基于相似性的曲率自适应点模型简化算法,相似性包括强特征边性和表面区域几何特征相似性2个方面.利用法向张量投票方法,计算采样点的特征边性,由此将点模型分为强边性和非强边性2部分;基于Mean Shift聚类法,对非强边性部分进行表面区域几何特征相似性聚类;对强边性部分和各类簇重采样,实现曲率自适应的简化,并通过移动最小二乘曲面,评估简化曲面的误差.实验结果表明,该算法有效地保持了特征边界部分和曲面的细节,且能够生成高质量的简化点集曲面  相似文献   

17.
社区探测是图和网络领域非常关键的技术之一,其中聚类方法扮演了重要的角色。针对层次聚类算法较高的时间复杂度,在信息理论框架下提出一种改进的社区探测方法 p IBD。p IBD把单部网络变换成二部图网络,预测k值,并基于信息瓶颈理论进行划分式聚类。实验结果表明,p IBD方法可以获得较已有层次聚类方法更高的准确率。  相似文献   

18.
一种低复杂度的雷达信号分选方法   总被引:2,自引:0,他引:2  
针对现有支持向量聚类算法在雷达信号分选应用中复杂度高、用传统有效性指标难以描述最佳分选效果的问题,研究了基于锥面聚类分配的支持向量聚类算法;利用该算法依赖于特征空间和数据空间近似覆盖的特性,避免了邻接矩阵的计算.提出了基于相似熵的有效性验证指标,应用信息熵的理论描述了类内聚集性和类间分离性.仿真结果表明,该方法在保证分选正确率的同时,可以有效降低计算复杂度,在一定程度上满足了情报侦察系统的实时性和准确性要求,具有较强的实用价值.  相似文献   

19.
针对基于因子图模型的非线性失真信道的迭代均衡计算复杂度高的问题,提出了3种不同的接收信息后验概率的有效算法以及并行实现方法。在基于因子图的均衡算法中,均衡器和译码器以迭代处理的方式联合工作,提高了系统的整体性能,但计算复杂度随信道记忆长度呈指数增加,通过Markov链蒙特卡洛算法实现多维积分的计算,并通过因子图分割实现并行Gibbs采样,降低了计算复杂度,仿真表明,该算法有效克服宽带高阶调制的卫星信道非线性失真,有利于硬件或多核并行实现。  相似文献   

20.
针对基于信息熵的决策树算法中存在多值属性偏向、连续属性处理不佳和时间复杂度较高等问题,提出一种基于离散比概念的决策树特征度量方法.首先采用K-means聚类算法对连续性数值属性进行离散化处理,其次利用属性在各个分类中的权重以及在整个条件属性中的权重比值,计算出该属性的离散比,避免了计算熵过程中复杂的对数运算,最后根据离散比的大小确定各个特征属性之间的拓扑结构,完成树的构建.结果表明,相较于K_C4.5和Id3_improved两种改进的决策树算法,基于离散比属性分割的算法能更有效地解决多值属性偏向,降低算法的时间复杂度,并且在实际产生的连续性数据集的分类应用上有进一步的突破.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号