首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 218 毫秒
1.
通常大规模复杂网络中社团数量是未知的,针对K-means谱聚类社团发现算法无法自动确定社团数量和聚类精度不高的缺点,提出了基于本征间隙和模糊c均值算法的自动谱聚类算法发现算法(FCMASC).该算法利用特征值的最大本征间隙来确定社团划分数量k,以特征向量矩阵线性相关性来确定FCM算法的初始聚类中心,运用FCM算法来对特征矩阵向量矩阵进行聚类.实验结果显示FCMASC算法能够有效提高聚类精度.  相似文献   

2.
针对Internet网络延迟监测点的放置问题,将其转化为网络拓扑图聚类问题。根据网络层次结构特性,使用层次聚类法对网络节点进行聚类。利用网络节点的差异性,提出使用递归去除1度异常节点算法,在保证网络拓扑结构基本不变的前提下减少异常节点对聚类结果的影响。提出在聚类结果的每个类中选取度数最大的节点作为对应的类中心,监测点被放置在类中心位置上。实验结果表明,层次聚类法中最长距离法更适合对网络节点进行聚类,递归去除1度异常节点算法能够进一步提高聚类效果,有效地解决了监测点的放置问题。  相似文献   

3.
为了提高文本聚类的有效性,提出一种基于网络社团结构的文本聚类算法。基于语义知识库理论,利用文本集与词语间的关系,引入文本相似度概念,再结合Newman社团聚类算法特性,将文本集作为独立社团,用文本相似度表示社团联系的紧密程度,对网络文本进行聚类。实验结果表明,该方法有效可行。  相似文献   

4.
基于特征加权理论的数据聚类算法   总被引:1,自引:0,他引:1  
针对数据挖掘过程中数据聚类操作的初始聚类数目和初始聚类中心确定困难的问题,提出了一种软子空间结合竞争合并机制的模糊加权聚类算法.通过对软子空间聚类算法的目标函数进行改写,并结合数据簇势的大小对各数据簇进行竞争与合并操作,实现了对数据的聚类处理.结果表明,该算法能够准确地对数据样本进行聚类,并且聚类结果与初始数据簇数目和初始聚类中心无关,能够满足对高维数据聚类处理的需要,具有较好的实际应用价值.  相似文献   

5.
为了解决网络延迟检测点的有效放置问题,根据网络节点之间的网络延迟,使用系统聚类法对网络节点进行聚类,并使用递归去除1度异常节点算法提高聚类效果.提出动态距离和最小算法,在聚类结果的类中选取对应的类中心,检测点放置在类中心上.仿真结果表明,系统聚类法中类平均法更适合对网络节点进行聚类,递归去除1度异常节点后能表现出更好的聚类效果,通过动态距离和最小算法能找到放置检测点的最佳位置.使用系统聚类法中的类平均法、递归去除1度异常节点算法、动态距离和最小算法,能有效地解决网络检测点的放置问题.  相似文献   

6.
针对两阶段判别嵌入式聚类算法无法有效地反映数据的真实结构问题,提出一种两阶段判别嵌入模糊聚类算法。首先利用模糊C-均值算法对数据进行初始聚类,得到数据的初始隶属度矩阵,然后通过奇异值分解和求解最大散度差对数据降维处理,最后在低维子空间中对降维后的数据再次进行模糊C-均值聚类。通过对初始数据和降维后的数据进行模糊聚类提高算法的准确度。对比实验结果表明,该算法可获取最优聚类精度,并能更有效地反映数据的真实结构。  相似文献   

7.
提出一种基于分布式哈希表(DHT)的分布式子空间聚类(DISCLUS)算法,该算法对各结点存储的数据分别进行子空间聚类,对聚类结果进行合并,得到分布式系统的聚类结果.针对子空间聚类的特点,提出结果集缩减和结果集剪枝策略对结点间通讯进行优化.为实现结点聚类结果合并,提出分布式表决算法(DDV).该算法利用底层覆盖网的拓扑结构进行层次化表决信息收集,在动态网络环境中实现了对所有结点的无冗余覆盖.理论分析和实验表明,DISCLUS算法的聚类误差和通讯性能能够较好地适应系统数据集规模、网络规模和数据空间维度的增加.  相似文献   

8.
基于特征关联度的K-means初始聚类中心优化算法   总被引:3,自引:0,他引:3  
针对K-means算法在进行文本聚类时对初始聚类中心敏感的问题,提出基于特征关联度的初始聚类中心选择算法.由于在原始文本集中不易找到类别代表性都较强的多个独立文本作为初始聚类中心,因此先从降维后的文本特征集合中,选取关联度大的特征构造新的文本集,再利用“或运算”合并其中的相似文本得到初始聚类中心候选集,最后通过计算文本密度并结合“最小最大”原则从候选集中选取最优的初始中心.在5个数据集上进行对比实验,该算法在多数聚类结果中的F-score值都高于90%,熵值低于0.5,明显优于Mahout提供的K-means算法,表明该算法可选出高质量的初始聚类中心,得到更好的聚类结果.  相似文献   

9.
结合基于视觉原理的密度聚类算法对初始化参数不敏感、能发现任意形状的聚类、能够找出最优聚类及一趟聚类算法快速高效的特点,研究可以处理混合属性的高效聚类算法.首先简单改进基于视觉原理的密度聚类算法,使之可以处理含分类属性的数据,进而提出一种两阶段聚类算法。第一阶段使用一趟聚类算法对数据集进行初始划分,第二阶段利用基于视觉原理的密度聚类算法归并初始划分而得到最终聚类。在真实数据集和人造数据集上的实验结果表明,提出的两阶段聚类算法是有效可行的。  相似文献   

10.
针对k-prototypes聚类算法随机选取初始聚类中心导致聚类结果不稳定,以及现有的大多数混合属性数据聚类算法聚类质量不高等问题,提出了基于平均差异度的改进k-prototypes聚类算法.通过利用平均差异度选取初始聚类中心,避免了初始聚类中心点选取的随机性,同时利用信息熵确定数值数据的属性权重,并对分类属性度量公式进行改进,给出了一种混合属性数据度量公式.结果表明,改进后的算法具有较高的准确率,能够有效处理混合属性数据.  相似文献   

11.
针对目前谱聚类算法的相似图包含较多错误社区信息的问题,引入了概率矩阵的概念,提出了一种改进的谱聚类社区发现算法。该算法首先利用马尔可夫过程计算节点间的转移概率,并基于转移概率构建复杂网络的概率矩阵;然后以均值概率矩阵重新构造相似图;最后通过优化归一化切割函数实现社区划分。采用人工网络和现实网络与其他典型算法进行对比实验,实验结果表明,该算法能够更加精准地划分社区,具有更加良好的聚类性能。  相似文献   

12.
K-均值算法对初始聚类中心敏感,聚类结果随不同初始聚类中心波动。针对以上问题,提出一种基于最小方差的自适应K-均值初始化方法,使初始聚类中心分布在K个不同样本密集区域,聚类结果收敛到全局最优。首先,根据样本空间分布信息,计算样本方差得到样本紧密度信息,并基于样本紧密度选出满足条件的候选初始聚类中心;然后,对候选初始聚类中心进行处理,筛选出K个初始聚类中心。实验证明,算法具有较高的聚类性能,对噪声和孤立点具有较好的鲁棒性,且适合对大规模数据集聚类。  相似文献   

13.
针对数字音频信号分类问题提出了基于二型模糊集合理论的C均值聚类算法,并在此基础上应用跳跃基因遗传算法对聚类得到的初始模糊模型进行优化,最后采用向量相似性测度准则对优化后的模糊规则集合进行简化,得到最终的模糊分类器模型。与传统的一型模糊集合相比,二型模糊集合可以掌控更多的不确定性信息。基于二型模糊集合理论的C均值聚类算法对样本分布不均匀、结构不规则的样本集的聚类效果更精确。实例仿真结果对比显示,应用二型模糊C均值聚类算法的音频信号分类器比应用一型模糊C均值聚类算法的分类器得到的分类结果更准确。  相似文献   

14.
判断聚类结果中是否存在误分类的簇,即簇中包含的样本不属于同一类。若存在,则在已有聚类结果上使用加权方案,处罚误分类的簇,输出新的聚类结果。若不存在,则输出已有聚类结果。限制簇集中存在误分类的簇,消除初始聚类中心对K-均值算法的影响,提高聚类准确率。实验结果表明,该算法与K-均值算法、优化初始聚类中心的K-均值算法相比,在坏的初始化条件下,表现出更好的鲁棒性;在含有噪音的数据集中,表现出更好的抗噪性能;聚类效果更好。  相似文献   

15.
模块密度谱分的网络社团发现方法   总被引:1,自引:0,他引:1  
为有效地检测复杂网络中的社团结构,对评估与发现社团的模块密度函数(即D值)进行了优化.通过模块密度函数的优化进程,论证了模块密度函数被优化框定到广阔的谱分聚类方法中的矩阵松散最大化,并且提出了一种新的谱分算法.该算法允许自动选择最优的社团结构数目.在经典的计算机产生的随机网络及真实世界网络中检验了该算法.特别地,当网络中社团结构变得模糊时,实验结果显示这种新的算法在发现复杂网络社团上比基于模块密度的直接核方法及基于模块函数(Q)的谱分方法更加有效.  相似文献   

16.
有向网络社团结构的识别对于理解复杂系统的结构特性和动力学特性都有着重要的意义。提出了一种基于拉普拉斯矩阵多重特征向量的有向网络社团结构划分算法,该算法利用有向网络拉普拉斯矩阵的前c个较小特征值所对应的特征向量来划分有向网络的社团结构。在人工数据和实证数据上与模块度的谱优化算法和模拟退火算法做了对比实验。实验结果表明,当社团结构明显时,该算法的归一化互信息指标的值接近于1。当社团结构不明显时,该算法所取得的效果也优于谱优化和模拟退火算法。与这两种算法相比,在实证网络上模块度Q值也可以提高17.28%和19.21%。该文工作对于理解有向网络上拉普拉斯矩阵的多重特征向量与网络的社团结构的关系具有十分重要的意义。  相似文献   

17.
在能量异构无线传感器网络中,节点的初始能量在一定的范围内随机分布,负载均衡和降低能耗是传感器网络成簇算法的一个重要挑战.提出了适用于能量异构网络环境下的传感器网络生存时间优化成簇算法SNLOC(Sensor Network Lifetime Optimization Clustering Algorithm),该算法通过构造基于节点剩余能量的簇首选择机制和基于综合代价函数的簇域划分机制,在有效保证节点能量损耗公平性的同时逐渐降低网络节点间的能量差异,很好地延长了网络生存时间.模拟实验结果显示,在能量显著差异的网络环境中,SNLOC可以更好地实现负载均衡,极大地提高网络的生存时间.  相似文献   

18.
提出一种基于扩展凝聚点和网格的快速聚类算法CECPG(c lustering using extended condensation pointand grid).在CECPG算法的基础上提出一种基于扩展凝聚点和网格的增量聚类算法ICECPG(increm entalc lustering using extended condensation point and grid).通过扩张凝聚点准确反映数据空间的几何特征,然后采用网格和密度相结合的方法,利用爬山法和连通性原理进行聚类处理,并在差分数据的指导下进行增量聚类.实验结果证明,CECPG算法的聚类效果优于模糊聚类算法FCM和C lique算法.  相似文献   

19.
提出了一个基于密度和网格的子空间聚类算法.该算法运用启发式的密度连通思想来确定一维空间初始簇的生成,使用自底向上的搜索策略来发现存在子空间中的簇.实验结果表明,在处理高维数据时,在不牺牲算法的其他性能的同时提高了聚类的有效性,降低了对输入数据顺序及噪音数据的敏感性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号