首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 296 毫秒
1.
改进了传统的谱聚类算法,并优化了初始聚类中心的选择方法。传统的谱聚类算法虽然具有算法复杂度较低、适用范围广等特点,但受高斯核函数尺度参数影响较大。设计的算法通过引入万有引力模型进行相似性度量,设计了基于引力的相似性度量方法,以此消除尺度参数的影响;另外,提出基于密度与距离乘积的初始聚类中心选取方法,优化了初始聚类中心的选择。在UCI基准数据集上的实验表明,改进的算法消除了尺度参数σ影响的同时,也达到了比较好的NMI指标和Accuracy指标。最后,使用改进的算法设计了基于微博用户的群组探测方法,取得了较为理想的用户群组划分结果。  相似文献   

2.
为克服直觉模糊C-均值(IFCM)聚类算法应用于图像分割时,易受噪声影响,且对聚类中心初始值敏感的缺陷,给出显著信息引导的直觉空间模糊聚类图像分割方法。使用图像的显著信息初始化聚类中心,能够很大程度地防止算法陷入局部最优;将改进的融合局部空间信息的模糊因子引入到IFCM聚类算法中,可提升算法的抗噪性能。实验结果表明所给方法能在多种含噪声图像上得到较好的分割效果。  相似文献   

3.
针对核空间模糊局部信息C-均值聚类算法(KWFLICM)对低对比度图像抗噪性差的不足,提出一种基于噪声距离的核空间模糊局部信息C-均值聚类算法。该算法在KWFLICM算法的基础上改变隶属度约束条件并引入噪声距离δ获得一种改进的聚类目标函数,并借鉴现有噪声聚类思想构造出具有良好抗噪性的模糊聚类迭代隶属度和聚类中心表达式,最后给出相应的聚类分割算法。实验结果表明,该改进算法对于椒盐噪声干扰的对比度较弱的灰度图像比KWFLICM聚类分割算法更有优势。  相似文献   

4.
现有的k-均值聚类算法大都是以距离差异为基础的,而同等重要地依赖所有属性的相似性度量会引起误导.传统的k-均值算法选择的相似性度量通常是欧几里德距离的倒数,这种距离通常涉及所有的特征.而在距离公式中引入一些特征权值后,其聚类结果将依赖于这些权值,从而可以通过调整这些权值优化聚类效果.由于k-均值算法是迭代算法,很难直接确定其权值以优化聚类结果,因此提出了一种通过免疫算法学习权值的方法以改进聚类结果.实验结果显示,该方法确定的权重值在提高聚类效果方面是可行的、有效的.  相似文献   

5.
为了有效利用少量先验信息提高多视角数据聚类效果,提出了一种基于距离度量学习的半监督多视角谱聚类算法(简称ML-SMC)。首先,利用距离度量学习引入先验信息,将多视角数据映射到反映先验约束条件的空间.然后,根据相似性构造每个视角的视图,将多视角聚类问题转化为最小正则割的图划分问题。实验结果表明:ML-SMC算法聚类结果的精度优于3种经典的多视角聚类算法和4种半监督单视角聚类算法。并且通过利用少量先验信息ML-SMC算法能够有效提高聚类效果。  相似文献   

6.
自适应选取聚类中心K-means航迹起始算法   总被引:3,自引:0,他引:3  
为揭示多传感器观测数据的正态分布态势,实现对源于异类目标的跟踪,提出一种新的多传感器航迹起始算法,本算法主要特点是初始聚类中心的自适应选取以及对逻辑估计法的起始夹角修正。估计算法中采用不相似性度量阈值的角度衡量方法,同时还结合聚类数目自适应归纳及初始聚类中心的推演逼近,从而使单传感器的航迹起始估计算法可以应用于多传感器的航迹起始根据;然后对聚类后的数据采用修正的逻辑航迹起始算法起始目标航迹。蒙特卡洛估计表明,新的自适应K-means聚类估计区分呈团状分布的不同目标的能力好,且通过估计算法得到的目标非常接近真实目标位置。经过自适应聚类处理后的目标航迹起始估计可有效滤除杂波干扰,降低虚警概率,能够获得较好的多传感器航迹起始。  相似文献   

7.
针对并行化密度聚类的过程中,不同密度聚类簇边界点划分模糊,并且存在数据噪声,从而影响聚类性能,使聚类结果受制于局部最优影响的问题,提出一种基于MapReduce与优化布谷鸟算法的并行密度聚类算法。首先,该算法结合K-means中的近邻与逆近邻思路的策略KDBSCAN(K-means DBSCAN),通过计算各数据点的影响空间,以此重新定义基于密度的聚类(Density-based spatial dutering of apptications with noise,DBSCAN)算法中聚类簇的拓展条件,避免了不同密度聚类簇边界点划分模糊的问题;其次,结合KDBSCAN密度聚类中的近邻思想提出了一种可行的迭代性噪声点处理策略,减轻数据中噪声点对于聚类算法性能的影响;再次,提出基于传统布谷鸟算法的优化改进策略MCS(Majorization cuckoo search),通过衰减发现巢穴概率的权重,随着迭代搜寻次数的增加提升算法收敛速度,解决了聚类结果受制于局部最优的问题;最后,结合MapReduce提出了并行密度聚类策略MCS-KDBSCAN,通过并行化密度聚类算法运算,减轻了并行聚类...  相似文献   

8.
为解决k-means聚类算法中异常样本点破坏数据分布,致使簇中心发生较大偏差的问题,通过计算样本点与潜在簇中心的距离赋予样本点不同的权重,降低外点对数据分布的影响,并通过对权重向量施加0-norm范数在聚类模型中自适应移除外点. 采用交替最小化优化算法求解模型,在人工合成数据集和真实数据集上的实验表明,所提模型能有效降低外点对聚类的影响,可得到更有效的聚类效果.  相似文献   

9.
针对如何从层次聚类算法得到样本集的多种聚类结果中获得用户最满意的聚类结果,在深入研究聚类有效性的基础上,通过模糊相似性关系刻画聚类的类内致密性和类间分离性,建立了一个新的聚类有效性函数。在人工和实际数据集上的实验都表明了该有效性函数具有良好的性能。  相似文献   

10.
基于遗传算法的动态模糊聚类基于遗传算法的动态模糊聚类   总被引:13,自引:0,他引:13  
提出了一种基于遗传算法的动态模糊聚类方法。通过计算样本之间的模糊相似性,不失真地反映它们之间的内在关联。同时将样本之间的模糊相似性映射到样本之间的欧氏距离,即将高维样本映射到二维平面。利用遗传算法不断优化两者之间的映射,使样本之间的欧氏距离逐步趋近于其模糊相似性,实现动态模糊聚类。克服了聚类有效性对样本分布的依赖性;同时,增加了聚类的灵活性和可视化。该方法在性能上较经典的模糊聚类算法有一定改进,具有较好的聚类效果和较快的收敛速度。仿真实验结果证明了该方法的可行性和有效性。  相似文献   

11.
将核学习方法的思想和改进的选择C-均值聚类算法相结合,提出了一种改进的模糊核聚类算法,使其能对非超球体、含有噪音和离群点及样本不均衡的数据进行有效的聚类.通过引入高斯核函数,原样本的特征被非线性变换到高维核空间,提高了聚类性能.实验结果表明,该改进算法具有有效性.  相似文献   

12.
针对谱聚类算法计算复杂度高,不适用于合成孔径雷达图像分割的问题,利用谱聚类算法与权核k均值之间的等价性,提出一种基于局部相似性测度的SAR图像多层分割算法.首先提取图像中每个像素的小波纹理特征,利用每个像素点的纹理特征计算各自的局部尺度参数,进而构造像素点之间的邻接关系,然后利用最近邻规则对此邻接关系进行逐层合并,进行基础聚类和逐层细化实现像素点聚类,最终得到图像的分割结果.对人工纹理图像和SAR图像的分割结果表明了新算法避免了传统谱聚类算法对尺度参数的敏感性,获得了更优的分割性能.  相似文献   

13.
基于核方法的模糊聚类算法   总被引:31,自引:0,他引:31  
将核方法的思想推广到模糊C-均值算法,构造了基于核函数的模糊核C-均值算法,使其能够聚类非超球体数据、被噪声污染数据、多种模式原型混合数据、不对称数据等多种数据结构,并指出一阶多项式模糊核C-均值算法等价于模糊C-均值算法.人工和实际数据的实验结果表明,与模糊C-均值算法相比,模糊核C-均值算法在多种数据结构条件下可以有效地进行聚类.  相似文献   

14.
针对目前谱聚类算法的相似图包含较多错误社区信息的问题,引入了概率矩阵的概念,提出了一种改进的谱聚类社区发现算法。该算法首先利用马尔可夫过程计算节点间的转移概率,并基于转移概率构建复杂网络的概率矩阵;然后以均值概率矩阵重新构造相似图;最后通过优化归一化切割函数实现社区划分。采用人工网络和现实网络与其他典型算法进行对比实验,实验结果表明,该算法能够更加精准地划分社区,具有更加良好的聚类性能。  相似文献   

15.
将主元分析(principal component analysis, PCA)模型相似度(以下简称PCA相似度)和谱聚类(spectral clustering)算法相结合,并用于基于高炉历史数据挖掘的炉况工作点变化的分析。利用PCA相似度与距离相似度的加权来衡量滑窗数据集之间的相似度,进一步将数据集的聚类问题转化为图的最优划分问题,通过谱聚类得到聚类结果。该方法降低了高炉工作点漂移的影响,能够有效稳定的实现高炉炉况工作点的聚类。基于现场历史数据的离线测试表明:与已有的基于PCA相似度和k-means聚类的算法对比,本研究可以更加有效区分炉况工作点的跳变。  相似文献   

16.
文章提出了将HCM,FCM和核方法结合在一起的,一种改进模糊核聚类算法。该算法的思想是将样本数据映射到特征空间,然后在特征空间内计算类中心、隶属度以及距离表达式,再在特征空间内进行模糊聚类,并且针对个别样本(即隶属度比较接近的样本)加入了截集因子确定样本的归属,确保聚类的效果。实验结果表明,与传统的模糊聚类算法相比,改进的模糊核聚类算法在多种数据结构条件下可以有效地进行聚类,总体性能优于HCM,FCM和FKCM。  相似文献   

17.
A novel approach for constructing robust Mamdani fuzzy system was proposed, which consisted of an efficiency robust estimator(partial robust M-regression, PRM) in the parameter learning phase of the initial fuzzy system, and an improved subtractive clustering algorithm in the fuzzy-rule-selecting phase. The weights obtained in PRM, which gives protection against noise and outliers, were incorporated into the potential measure of the subtractive cluster algorithm to enhance the robustness of the fuzzy rule cluster process, and a compact Mamdani-type fuzzy system was established after the parameters in the consequent parts of rules were re-estimated by partial least squares(PLS). The main characteristics of the new approach were its simplicity and ability to construct fuzzy system fast and robustly. Simulation and experiment results show that the proposed approach can achieve satisfactory results in various kinds of data domains with noise and outliers. Compared with D-SVD and ARRBFN, the proposed approach yields much fewer rules and less RMSE values.  相似文献   

18.
以往建立在模糊C均值(fuzzyC-means, FCM)框架下利用源域虚拟簇中心作为迁移知识的迁移聚类算法容易受到离群点和噪声的干扰,且单个簇中心不足以描述簇结构。针对此问题,提出多代表点自约束的模糊迁移聚类算法,该算法引入样本代表权重机制为簇中每个样本分配代表权重来刻画簇结构,这种机制能更好的刻画簇结构,对离群点和噪声有较好的抑制作用;同时利用源域样本,重构目标域簇结构,并以此作为迁移知识进行目标域样本聚类,相对于利用单中心作为迁移知识来说,整体重构后的目标域簇结构所包含的迁移知识量更为丰富。试验结果表明。在人工数据集和真实数据集上,所提出的聚类算法相比对比算法, NMI和ARI最高提升了0.674 5和0.608 4。说明在迁移环境下,以代表点自约束作为知识迁移规则,所提出的聚类算法具有一定的聚类效果。  相似文献   

19.
针对聚类中广泛应用的经典k均值算法随机选择初始质心和易受孤立点影响的不足,给出了二次改进的k均值算法。首先使用距离法移除孤立点,然后采用邻近吸收法对初始聚类中心的选择进行改进,并做了改进前后的对比实验。结果表明,改进后的算法比较稳定、准确,受孤立点和随机选择质心的影响也有所降低。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号