首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 187 毫秒
1.
现有的软子空间聚类算法都是基于批处理技术的聚类算法,不能很好地应用于高维数据流或大规模数据的聚类研究.利用模糊可扩展聚类框架,与模糊加权软子空间聚类算法相结合,提出了一种有效的模糊加权流数据软子空间聚类算法(FWSSC).实验结果表明,FWSSC对于高维流数据可以得到与批处理软子空间聚类方法近似一致的实验结果.  相似文献   

2.
该文面向本体关系集合的自动构建,提出一种基于百科词条的本体概念聚类方法,用于发现领域概念之间的语义关系。在给定领域本体概念集合的条件下,该方法首先获取相关的百科词条并建立每一概念的向量模型,然后根据距离判别法进行概念聚类,得到概念间的相近关系。采用该方法对3个领域中的领域概念集合进行聚类,实验结果表明,该文方法比传统聚类算法有更好的聚类结果,有助于概念间关系的自动获取和领域本体自动构建。  相似文献   

3.
对K-Harmonic Means算法进行扩展,考虑到数据点对不同类的隶属关系,将模糊的概念应用到聚类中,提出了模糊K-Harmonic Means算法,推导出聚类中心和模糊隶属度的迭代公式.在中心迭代聚类算法统一框架的基础上,推导出FKHM算法聚类中心的条件概率表达式以及在迭代过程中的数据加权函数表达式.最后,用Folkes & Mallows指标对聚类结果进行评价.实验表明,模糊K-Harmonic Means(KHM)算法在聚类对于初值不敏感的同时提高了聚类结果的精确度,达到较好的聚类效果.  相似文献   

4.
针对现有搜索引擎的搜索结果数目庞大要从中找到有用信息十分困难的问题,基于将Web搜索结果进行聚类可以方便用户快速浏览搜索结果的思想,提出了一种基于形式概念分析的Web搜索结果聚类方法。首先从搜索结果中集中提取关键短语和非关键短语,然后从搜索结果集到关键短语和非关键短语集上建立形式背景,采用一种较快概念格生成算法在该形式背景上生成概念格,概念格上的一个概念表达了具有确定意义的主题,即得到Web搜索结果的一个类:每个概念内涵具有的关键短语或非关键短语作为类标记;概念的外延所包含的搜索结果文档作为该类的内容;搜索结果各个类之间的层次关系通过概念格上的层次关系得以体现。  相似文献   

5.
一种基于最大模糊熵的高斯聚类算法   总被引:5,自引:0,他引:5  
介绍了一种新的模糊聚类方法,定义了模糊熵,提出了基于最大模糊熵的模糊聚类的方法,得到了一种新的聚类算法——GCM算法。该算法的物理意义清晰,有明确的数学含义,相对于传统的FCM聚类算法,其聚类效果更好。  相似文献   

6.
为解决核模糊相似性度量谱聚类算法的样本点降噪问题,优化聚类效果和稳定性,本文从分析异常点分布特性出发,引入局部异常因子(LOF)算法,提出聚类中心候选对象的概念,过滤数据集的噪声数据,从而优化初始聚类中心的计算,突出正常样本点在聚类中心调整中的影响力,使聚类算法更易于得出准确的聚类结果. 同时提出一种局部过滤因子以修正相似性度量的方法,该方法通过放大正常数据之间的权值、缩小正常数据与噪声数据间的权值,使优化后的核模糊谱聚类算法大大降低对异常点的敏感度. 算法有效性实验和算法稳定性实验表明:该方法对相似性度量修正的有效性使核模糊谱聚类算法更为稳定和鲁棒.  相似文献   

7.
基于后置近邻函数准则的改进型模糊聚类算法   总被引:2,自引:0,他引:2  
针对不规则形状分布的数据,提出了一种新型模糊聚类算法.该方法结合了近邻函数准则分类算法,对模糊C均值聚类算法进行了拓展.仿真实验表明对球形分布的数据和非球形分布的数据,这种新算法的聚类性能优于模糊均值聚类算法。  相似文献   

8.
针对模糊C-均值聚类算法对聚类数预先不可知和谱系聚类所具有的缺陷,提出了混合模糊谱系聚类算法,该算法结合模糊聚类和谱系聚类,自动确定聚类数目,并可以有效的对数据进行聚类.实验表明,该算法具有良好的有效性和可行性.  相似文献   

9.
自适应的模糊C均值聚类算法   总被引:1,自引:0,他引:1  
针对模糊C均值聚类算法对聚类数预先不可知的缺陷,提出了自适应的模糊C均值聚类算法,该算法利用已有的有效性函数自动确定聚类数目,继而进行模糊聚类,实验表明,该方法无须人工的干预,并且具有良好的有效性和可行性.  相似文献   

10.
为了有效处理三维列联表数据,采用模糊联合聚类算法的思想,提出一种基于信息瓶颈理论的模糊三维聚类算法(IBFTC).IBFTC算法为每个维度指定隶属度函数,可实现3个维度上的同时聚类,且在目标函数中引入信息瓶颈理论计算对象与簇之间的距离.采用MovieLens数据集对IBFTC算法进行多方面分析,结果表明,IBFTC算法可获得比现有模糊联合聚类算法更高的聚类准确率.  相似文献   

11.
基于蚁群算法的模糊C均值聚类医学图像分割   总被引:1,自引:0,他引:1  
在医学图像分割研究中,针对模糊C均值(FCM)聚类算法聚类个数难于确定、搜索过程容易陷入局部最优的缺陷,把蚁群算法与FCM聚类算法有机结合,提出了一种基于蚁群算法的模糊C均值聚类图像分割算法. 该算法首先利用蚁群算法全局性和鲁棒性的优点,得到聚类中心和聚类个数,再将其作为模糊C均值聚类的初始聚类中心和聚类个数,弥补了传统FCM聚类算法的不足,得到了较好的分割效果. 实例分析证明了算法的有效性和实用性.  相似文献   

12.
概念格因其结构生动简洁地表明概念之间的泛化一例化关系,成为一种有效的数据挖掘工具。然而直接从形式背景中直接构造概念格的效率较低,为了提高概念格的构造效率,针对形式背景中的多个属性合并,给出了一种基于概念提升的概念格更新构造算法UCP.该算法充分利用了属性合并之前的概念格,仅对部分概念结点进行更新处理,从而提高了概念格的构造效率。最后,以恒星光谱数据作为形式背景,采用VC++6.0和Oracle9i为开发工具,实验验证了该算法的有效性。  相似文献   

13.
基于特征加权理论的数据聚类算法   总被引:1,自引:0,他引:1  
针对数据挖掘过程中数据聚类操作的初始聚类数目和初始聚类中心确定困难的问题,提出了一种软子空间结合竞争合并机制的模糊加权聚类算法.通过对软子空间聚类算法的目标函数进行改写,并结合数据簇势的大小对各数据簇进行竞争与合并操作,实现了对数据的聚类处理.结果表明,该算法能够准确地对数据样本进行聚类,并且聚类结果与初始数据簇数目和初始聚类中心无关,能够满足对高维数据聚类处理的需要,具有较好的实际应用价值.  相似文献   

14.
多源数据的知识发现是当今大数据分析领域中的重要课题。文章研究多源形式背景的信息融合方法。借助剩余格理论提出了一种将多源同域形式背景融合为一个 L 模糊形式背景的方法;刻画了融合形式背景中的 L 模糊概念与相应的单源形式背景中的形式概念之间的关系,给出了形式概念之间的相互诱导方法。  相似文献   

15.
在无先验知识的前提下,复杂网络聚簇需确定簇数并精确地将节点分配到其所属簇,而大部分传统聚簇方法无法自动确定簇数。为解决这一问题,结合GEP和信息论聚类框架,提出了复杂网络自动聚簇算法——AutoC-NC-GEP。算法为复杂网络聚簇建立了GEP结构模型,设计了有效的遗传算子,提出了"不完全聚簇划分"概念,并分别以Map Eqation和Modularity两种不同的网络社团结构量化函数为适应度函数,使用真实网络对算法的聚簇性能进行了测试。实验结果表明,在没有先验知识的前提下,AutoCNC-GEP算法不仅能正确解析网络的社团数量,还可以自动将节点精确地分配到其所属社团中,从而获得网络的最佳社团结构。  相似文献   

16.
在基于形式概念分析的中文领域本体学习中,为提高概念格构建效率,将概念格约简理论应用于概念格构建中。首先对基于语义依存分析获取的形式背景进行对象和属性约简,然后基于约简的形式背景采用Godin算法构造概念格,最后根据修复定理修复约简概念格,得到完整的概念格。通过有关对萝蘼科植物的文本学习,得到一个萝蓐科植物领域本体。实验结果表明,引入概念格约简理论,概念格的构建效率提高70%,进而提高了领域本体构建的效率。  相似文献   

17.
模糊C-均值(FCM)聚类算法的一个主要问题是需要事先确定聚类的数目,为此定义了类内差异度和类间重叠度来分别度量同一个聚类中数据的相似度和不同聚类间的分离程度,进而基于这两个度量提出一个新的有效性函数用于判定最佳聚类数目。实验结果表明,该有效性函数能有效地判定聚类数目,并且有较好的鲁棒性。  相似文献   

18.
SAR图像变化检测可以转化为对差异图的聚类问题。由于 SAR 图像本身容易受到斑点噪声干扰,为提高聚类效果提出了一种结合邻域信息的自适应粒子群聚类算法。该方法在模糊 C 均值原目标函数基础上,引入中心像素的邻域信息,并通过自适应粒子群的全局搜索来优化聚类中心。该方法还引入了自学习算子即粒子编码中的中心像素的隶属度,能够向其相邻像素的隶属度学习,并据此修正自身的隶属度值相关。实验结果表明,与模糊C均值和量子免疫克隆聚类算法相比,该方法利用了像素的邻域信息,从而增强了抗噪性能。与模糊局部信息C均值算法相比,该方法对图像细节保持能力较强,运行时间也较少。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号