首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
基于商空间的非均匀粒度聚类分析   总被引:4,自引:0,他引:4  
徐峰  张铃 《计算机工程》2005,31(3):26-28,53
采用距离度量空间的手段讨论了商空间的模糊粒度聚类,结合信息融合技术用不同粒度合成聚类结果,认为聚类可以以非均匀粒度来描述样本集。据此提出了使用Gaussian型函数定义商空间的距离函数的模糊聚类算法(FCluster算法),算法用距离表示信息粒度,不需要定义隶属函数和求出相似矩阵,并且不需要讨论参数的选择。仿真实验说明了算法可以很直观地从不同粒度(距离)观察聚类结果,大大降低了计算复杂度和空间复杂度,适于处理大数据量的样本,并且Gaussian型函数定义的距离对试验样本可以达到很好的效果。  相似文献   

2.
商空间信息粒度模型可以从不同角度、不同层次观察问题.本文首先将商空间理论中论域合成技术进行推广,根据已知的粒度知识给出了粒度搜索范围,在问题求解中,降低了计算复杂度.然后讨论了模糊商空间粒度计算和分层递阶结构的关系,用不同粒度的商空间模型来表示聚类的结构.据此提出了基于Gaussian型函数的模糊聚类算法(G-FCluster算法),算法用距离表示信息粒度,不需要定义隶属函数和求出相似矩阵,并且不需要讨论参数的选择.将算法应用于中国证券市场,并与FCM算法进行比较.实验说明了算法可以很直观地从不同粒度(距离)观察聚类结果,大大降低了计算复杂度和空间复杂度,适于处理大数据量的样本.  相似文献   

3.
犹豫模糊语言术语集(Hesitance Fuzzy Linguistic Term Sets,HFLTSs)允许决策者们用几个可能的语言术语来评估一个属性.近来,采用HFLTSs来进行模糊聚类分析的问题越来越受关注.考虑到目前基于HFLTSs的模糊聚类算法还存在计算复杂度高的问题,提出了一种新的正交模糊聚类算法:首先计算样本之间的距离测度得到距离测度矩阵,接着计算其等价矩阵;然后确定置信水平值,通过置信水平值对等价矩阵进行切割;最后根据切割矩阵的列向量之间的正交关系来确定对应样本是否可以放在同一个类别,以此得到聚类结果.该算法步骤简单,计算复杂度低,并且适合于数据量大的模糊聚类问题.本文末尾将通过一个实例结合k-means聚类算法证明该算法的可行性和高效性.  相似文献   

4.
目前,基于基数排序的等价类划分算法有较低的时间复杂度但存在以下不足:属性值跳跃性大时会产生大量空队列;排序后仍需O(|PU|)的时间才实现划分,求出等价类,排序没能发挥应有作用。为此,设计了一种新算法,通过属性值映射避免大量空队列产生,通过增加一个记录等价类长度信息的计数数组,排序后仅需O(|U|)就可实现划分,求出等价类。整个算法时间复杂度为O(|CU|),空间复杂度为O(|U|),为求等价类划分提供了一个新的解决办法。  相似文献   

5.
数据流的无限性、连续性和速度快等特点,使得挖掘出所有准确的数据流频繁项通常是不可能的.算法的空间复杂度和时间复杂度通常是评价频繁项挖掘算法优劣的两个主要度量.通过引入局部性原理改进数据流近似频繁项的挖掘算法,该算法的空间复杂性为O(1/ε),数据流每个数据项的最坏处理时间是O(1/ε),其最好处理时间是O(1),输出结果的频率值误差为∑_(i=2)^j(1-μi)×ki。  相似文献   

6.
Vague关系作为模糊关系的一种推广,在某些情况下,比直觉模糊关系具有更强的模糊信息表达能力。通过对照关系和模糊关系的传递闭包,把求模糊矩阵的传递闭包算法完整地推广到Vague关系矩阵上,从而可以将相似Vague关系矩阵转换为等价Vague关系矩阵,进而通过设定肯定、否定双维度阀值αtαf,将此等价的Vague关系矩阵转化成一个等价的布尔矩阵,最终使得达到聚类分析的目的。最后通过一个实例给出了这种聚类分析方法在模式识别中的应用。  相似文献   

7.
近年来谱聚类算法在模式识别和计算机视觉领域被广泛应用,而相似性矩阵的构造是谱聚类算法的关键步骤。针对传统谱聚类算法计算复杂度高难以应用到大规模图像分割处理的问题,提出了区间模糊谱聚类图像分割方法。该方法首先利用灰度直方图和区间模糊理论得到图像灰度间的区间模糊隶属度,然后利用该隶属度构造基于灰度的区间模糊相似性测度,最后利用该相似性测度构造相似性矩阵并通过规范切图谱划分准则对图像进行划分,得到最终的图像分割结果。由于区间模糊理论的引入,提高了传统谱聚类的分割性能,对比实验也表明该方法在分割效果和计算复杂度上都有较大的改善。  相似文献   

8.
基于Dubois提出的带参数ξ的t-模Tξ,提出了一种参数化的广义模糊联想记忆网络Max-Tξ FAM。由于Tξ中参数ξ的作用,在应用中Max-Tξ FAM有更强的可调性和灵活性。接着利用Tξ的伴随蕴涵算子,提出了Max-Tξ FAM的一种有效学习算法。从理论上严格证明了,只要Max-Tξ FAM能完整可靠地存储所给的多个模式对,则所提出的学习算法一定能找到使得网络能完整可靠存储这些模式对的所有连接权矩阵的最大者。最后,用实验说明了所提出的学习算法的有效性。  相似文献   

9.
基于概率潜在语义分析的Web用户聚类   总被引:1,自引:1,他引:0  
Web用户聚类知识可以为改进信息搜索效率和提供个性化服务提供帮助。通过对海量日志记录分析,构建会话-页面矩阵;根据信息论理论,在会话-页面矩阵中权值计算中考虑局部和全局权值贡献;利用概率潜在语义分析将隐式变量Z对页面P的条件概率转换为隐式变量Z对会话S的条件概率,然后在聚类分析中以此作为相似度计算依据。聚类算法采用了基于距离的k-medoids算法,以进一步改善聚类精度。实验结果验证了该算法的有效性和局限性。  相似文献   

10.
确定型格值有限自动机的最小化   总被引:2,自引:2,他引:0       下载免费PDF全文
给出了确定型格值有限自动机的定义,并同时给出了有效终止状态和可达到状态的定义。指出了求取DLFA M=Q,Σ,δ,q0的实质是求取Q/Rk。由此以可到达状态为基础引入了等价关系RkSk与商集Q/Sk,证明了Rk=Rk-1Sk,由此得到Q/Rk的等价类为Q/Rk-1中等价类与Q/Sk中等价类的非空交集全体。引入了Hk,并证明了可由Hk求取Q/Sk,从而得到仅利用集合运算便可求取Q/Rk的算法,最终给出了DLFA最小化算法的一个容易实现的构造型描述和相应示例。  相似文献   

11.
文本聚类是文本挖掘的一种重要方法.基于形式概念分析和概念相似度,给出一种新的多背景文本模糊聚类方法和模型.该方法不仅考虑了多背景关键词之间的语义关系,而且通过非距离计算得到模糊相似矩阵. 可根据不同要求得到相应的聚类结果,具有较好的灵活性.最后通过示例说明了所给算法的可行性.  相似文献   

12.
基于分级神经网络的Web文档模糊聚类技术   总被引:1,自引:1,他引:1  
给出了一种多层向量空间模型,该模型将一篇文档的相关信息从逻辑上划分为多个相对独立的文本段,按照不同位置的文本段确定相应的索引项权重.然后提出了一种简明而有效的基于分级神经网络的模糊聚类算法.与现有方法不同,该模糊聚类方法采用自组织神经网络和模糊聚类网络两部分组成的3层神经网络来实现.首先采用自组织神经网络从原始数据产生一个初始聚类结果,然后运用FCM方法对初始聚类的数目进行优化.实验结果表明,提出的Web文档聚类算法具有较好的聚类特性,它能将与一个主题相关的web文档较完全和准确地聚成一类.  相似文献   

13.
模糊聚类在中文文本分类中的应用研究   总被引:4,自引:0,他引:4  
将基于等价关系的模糊聚类技术应用于中文文本分类,提出了基于模糊聚类的中文文本分类算法ATCFC。该算法利用基于二级字索引的正向最大匹配算法对文本分词,建立模糊特征向量空间模型,使用贴近度法刻划文本间的相似度。利用算法ATCFC对文本集合进行动态聚类实验,实验结果表明算法ATCFC对于中文文本分类是可行、有效的。  相似文献   

14.
提出一种基于矩阵加权关联规则的区间模糊C均值聚类算法。根据支持度和可信度对矩阵构造关联规则,在关联规则的基础上进行区间模糊C均值聚类。由样本数量的大小来调整区间的影响因子a以达到最优聚类。该算法在解决小型文本时精度优于传统算法(如k-means),在解决多维数据时效率较理想。理论和实验表明,该算法可以在一定程度上提高聚类结果的质量和算法效率。  相似文献   

15.
首先,选择合适的文本集合,并且对文本进行分词处理,然后,进行文档内部特征词的提取,通过采用词频统计的方法对文本向量进行降维处理,从而选择最佳的特征向量。最后,将非数值的文本数据进行量化处理后,利用减聚类优化的模糊C-均值算法对文本集合进行聚类,从而提高文本聚类的效果。  相似文献   

16.
和导航中应用广泛。文本聚类作为一种无监督学习算法,其依据是聚类假设:同类的文档相似程度大,不同类的文档相似程度小。文中主要研究汉语文本聚类算法在新闻标题类文本中的应用。首先对采集到的若干条新闻标题进行分词和特征提取,将分词后的文本转化为词条矩阵;然后使用TF-IDF技术处理词条矩阵,得到基于分词权重的新的词条矩阵,对新的词条矩阵进行奇异值分解,得到主成分得分矩阵,提取主成分分析文本特征并根据主成分得分矩阵进行K-均值和分层聚类分析;最后将聚类结果用词云图的形式展示出来并评价聚类效果的好坏。实证显示,对词条矩阵的奇异值分解能降低向量空间的维数,提高聚类的精度和运算速度。  相似文献   

17.
基于模糊矩阵的蚁群聚类算法研究与应用   总被引:1,自引:0,他引:1       下载免费PDF全文
提出了基于模糊矩阵的数据聚类模型,其中引入了聚类过程的全局性控制模糊矩阵,描述了数据聚类的过程;提出了基于模糊矩阵的蚁群聚类算法,实验结果证明了算法的正确性和高效性。  相似文献   

18.
耿新青  王正欧 《计算机工程》2006,32(20):22-24,4
提出了一种新的动态模糊自组织神经网络模型(DFKCN),并将其用于文本聚类中。将DFKCN模型应用到中文文本聚类中,该文的特征向量的表示采用隐含语义分析理论,以体现特征词的语义关系并实现特征词的降维。仿真表明本聚类法的精度高于TGSOM算法的精度,算法的执行效率高于TGSOM,取得了良好的效果。  相似文献   

19.
基于MATLAB的模糊聚类分析的传递方法   总被引:5,自引:1,他引:5  
聚类分析中的传递方法是直接通过模糊相似矩阵获得动态聚类图,该方法比通过传递闭包法求模糊等价矩阵而获得动态聚类图的方法在时间复杂度和空间复杂度要小,本文对重点介绍传递方法,并给出了由MATLAB语言实现的算法程序,并介绍了一个应用实例。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号