首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 66 毫秒
1.
为有效实现海量数据的非线性聚类,提出基于GraphLab的分布式流式近邻传播算法--GStrAP(GraphLab based stream affinity propagation)。该算法将数据抽象为有向无环图模型,采用“Gather-Apply-Scatter”的模式完成数据同步和算法迭代。在人工合成流形数据3D Clusters、Aggregation、Flame和Pathbased数据集上分别采用不同数据规模以及与传统K-means的聚类性能做对比,实验表明:基于GraphLab的近邻传播算法对数据规模具有良好的拓展性,在保持算法聚类效果的同时,有效降低时间复杂度。  相似文献   

2.
针对K均值聚类算法对类簇数目预先不可知及无法处理非凸形分布数据集的缺陷,提出基于进化思想的聚类算法及其类簇融合算法.该算法将K均值聚类算法嵌入进化聚类算法框架中,通过调整距离倍参,将数据逐渐划分,在此过程中自动确定类簇数目,提出基于最近距离的中间圆密度簇融合算法和基于代表类的中间圆密度簇融合算法,将相似度大的类簇进行融合,使得k值逐渐趋向真实值.实验表明,该方法具有良好的实用性.  相似文献   

3.
针对现有聚类集成谱算法聚类结果不稳定的问题,引入近邻传播聚类思想,设计了基于近邻传播的聚类集成谱算法(APCESA).该算法先由聚类集成和谱分得到空间结构相对简单的文本低维嵌入,然后通过近邻传播算法得到最终的聚类结果.在谱分解过程中,采用矩阵变换方法,避免了谱算法中特征值分解的高昂计算代价.对真实文本数据集的实验结果表明,所提算法比对比算法聚类更稳定,且聚类结果的NMI值和ANMI值均高于对比算法.  相似文献   

4.
为改善近邻传播聚类算法对高维数据的聚类效果,引入马氏距离替换原算法中的欧氏距离,并借助正则化总散度矩阵的奇异值分解实现数据变换预处理,进而在在降维后的变换子空间中对数据集进行聚类。针对Iris、User、Soybean和Vehicle四个数据集,选取适当正则化参数,经仿真实验可见,改进算法的聚类精度在整体上有所提高。  相似文献   

5.
基于后置近邻函数准则的改进型模糊聚类算法   总被引:2,自引:0,他引:2  
针对不规则形状分布的数据,提出了一种新型模糊聚类算法.该方法结合了近邻函数准则分类算法,对模糊C均值聚类算法进行了拓展.仿真实验表明对球形分布的数据和非球形分布的数据,这种新算法的聚类性能优于模糊均值聚类算法。  相似文献   

6.
为了能够快速准确地发现自然分布的、任意形状密度变化的聚类,提出了基于近邻传播的快速扫描算法,该算法利用最近邻居关系的传递特性实现数据集合的完全聚类,简化了传统聚类方法的最近邻居判定和计算,优化了搜索过程,实现了快速聚类分析过程。通过与同类算法的比对验证,结果表明该算法对目标数据集合的任意分布特性有很好的适应能力。  相似文献   

7.
针对多维数据属性对聚类分析结果有不同重要程度影响的问题,提出一种基于自适应属性加权的近邻传播聚类算法。该方法通过考虑多维数据属性权值的重要度,在近邻传播聚类过程中引入属性加权相似性矩阵计算,并根据当前数据聚类划分的结果来分析目标评价函数,计算各个属性对当前聚类的贡献程度。随后根据贡献程度的计算结果自适应地更新属性权值,并通过属性加权相似性矩阵来重新计算近邻传播算法中的两种竞争信息,进而提高聚类结果的质量。数值实验结果表明,新方法能够有效实现属性权值的自适应调整,提高近邻传播算法的聚类效果,与其他传统聚类算法相比新方法具有更好的聚类质量。  相似文献   

8.
协同过滤技术是推荐系统最具价值的核心技术之一,它能够深入地挖掘用户潜在的兴趣爱好并向用户做出比较合理的推荐;但是冷启动、数据稀疏性、可扩展性等问题依然制约该技术在实际推荐系统的应用。针对冷启动和数据稀疏性等问题,文章提出了一个基于近邻传播聚类的混合协同过滤推荐模型。该模型首先基于物品的标签属性进行聚类,挖掘出同类的物品并计算相似物品之间的关联程度,然后基于历史交互数据计算物品的相似度矩阵,最后按照一定权重混合构成一个物品相似度,并以此为用户进行推荐。与传统协同过滤推荐模型相比,该模型不仅提高了推荐精确度,而且改善了物品的召回率,能为用户提供更好的推荐体验。  相似文献   

9.
近邻传播聚类算法(affinity propagation, AP)受偏向参数影响较大,很难确定最优聚类所需的参数。设计了两阶段近邻传播半监督聚类算法(two-stage semi supervised clustering algorithm based on affinity propagation, 2SAP),在整个数据集上运行半监督近邻传播算法(semi-supervised clustering based on affinity propagation, SAP),得出类代表点集合,在类代表点集合上运行SAP算法得出结果。在实际数据集上进行实验,结果证实:与算法SAP和并行近邻传播半监督聚类算法(parallel computation of semi-supervised clustering algorithm based on affinity propagation,PSAP)相比,2SAP算法的CRI和FCRI值较高,而相应的离散系数较小,说明2SAP受偏向参数的影响较小。  相似文献   

10.
传统的K-means算法是一种常用的聚类算法,但它对于初始聚类中心敏感,容易受到"噪声"和孤立点的影响,由此提出了一种基于网格的二次K-means聚类算法.此算法先将空间划分为多个大小相等的网格,然后根据给定的密度阈值来计算出密集网格,对密集网格中的点进行初次聚类,将初次聚类结果的均值点作为第二次聚类的初始均值点,从而消除了"噪声"和孤立点的影响,并且保证了信息的完整,实验证明此算法是有效的.  相似文献   

11.
In order to improve the accuracy and efficiency of 3D model retrieval, the method based on affinity propagation clustering algorithm is proposed. Firstly, projection ray-based method is proposed to improve the feature extraction efficiency of 3D models. Based on the relationship between model and its projection, the intersection in 3D space is transformed into intersection in 2D space, which reduces the number of intersection and improves the efficiency of the extraction algorithm. In feature extraction, multi-layer spheres method is analyzed. The two-layer spheres method makes the feature vector more accurate and improves retrieval precision. Secondly, Semi-supervised Affinity Propagation (S-AP) clustering is utilized because it can be applied to different cluster structures. The S-AP algorithm is adopted to find the center models and then the center model collection is built. During retrieval process, the collection is utilized to classify the query model into corresponding model base and then the most similar model is retrieved in the model base. Finally, 75 sample models from Princeton library are selected to do the experiment and then 36 models are used for retrieval test. The results validate that the proposed method outperforms the original method and the retrieval precision and recall ratios are improved effectively.  相似文献   

12.
基于仿射传播聚类的富模型降维方法   总被引:1,自引:0,他引:1  
富模型的提出为HUGO隐写算法的分析提供了新的思路,但是富模型特征维数高,冗余大,容易造成维数灾难问题;本文通过分析富模型特征结构,利用非线性距离定义特征距离,使用仿射聚类方法和图的谱理论,确定特征的聚类中心,将聚类中心所对应的特征作为新特征,使用Fisher集成分类器进行隐写分析。实验结果表明,经过该降维方法处理的SRM(空域富模型)在特征维数降低到8000维时,对于S-UNIWARD、WOW、HUGO隐写算法有着较低的检测错误率,最大降幅达到43.1%  相似文献   

13.
考虑到工业生产数据具有按工作点聚类和迁移的特点,提出了一种基于自适应仿射传播聚类(adAP)的多最小二乘支持向量机(LSSVM)算法进行软测量建模。该方法用adAP算法对训练样本进行分类以找到最优的聚类结果,采用LSSVM算法对各类样本分别建立子模型,并根据当前工作点所属子类的模型进行预测输出。将该方法用于聚丙烯熔融指数的软测量建模,结果表明,与其他方法相比该方法具有更高的回归精度和良好的泛化能力。  相似文献   

14.
针对无线传感器网络中的LEACH算法的簇头节点分布不均匀的不足之处,提出了一种基于聚类的无线传感器网络的分簇算法.该算法将传感器网络按照节点的实际分布情况采用聚类算法聚成几个类(分簇),在各分簇中分别选择簇头节点.模拟实验结果显示算法与LEACH相比具有更好的性能.  相似文献   

15.
利用方差最大化原理,结合灰色理论提出了一种基于指标白化权函数值的方差最大化的灰色聚类指标客观权重确定方法,反映了指标信息的重要性由聚类指标的差异程度体现.综合主观权重确定的最小平方法,建立了基于线性组合赋权模型,并通过实例对模型进行求解,验证了该模型的客观性与有效性.  相似文献   

16.
针对真实场景中大量类别数未知、样本数量不均衡、数据分布复杂等导致人脸图像智能提取准确率低的问题,提出了基于关联图关键边发现的人脸图像聚类算法。首先,通过融合多个卷积神经网络提取的图像样本特征,获得鉴别性更强的特征向量,并计算不同样本之间的相似度;然后,利用拒真率和认假率设置合适的门限值,将得到的相似度结果与门限值进行比较,筛选出相似程度高的样本对,并添加样本对之间的连接边来构建关联图;再利用介数中心性测度,设计关键边发现方法,挖掘关联图中可能连接不同簇的重要连接边;最后,采用图卷积网络确认是否存在上述重要连接边以获得最终的聚类簇。实验结果表明,所提算法能够提高人脸图像聚类的准确率。  相似文献   

17.
结合阈值变权的思想提出了一种基于指标白化权函数值的灰色聚类方法,采用阈值原则对属性间的灰色属性关联矩阵进行标准化使得属性权重分配更加符合实际问题的需要.最后建立了某资产管理公司的项目评估决策模型,验证了模型的客观性与有效性.  相似文献   

18.
利用模糊c均值(FCM)算法是一种最流行的模糊聚类的方法,因为它的效率,计算简单,容易实现.但是针对FCM对初始化敏感和易陷入局部最优解,在本文出了一种基于粒子群算法的模糊聚类.仿真实验结果表明了该方法对有效性和全局性优化.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号