首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
一个新的模糊聚类有效性指标   总被引:3,自引:1,他引:2       下载免费PDF全文
孔攀  邓辉文  黄艳艳  江欢 《计算机工程》2009,35(12):143-144
提出一个新的模糊聚类有效性指标。该指标能确定由模糊C-均值算法(FCM)所得模糊划分的最优划分和最优聚类数,结合了模糊聚类的紧致性和分离性信息,用类内加权平方误差和计算紧致性,用类间相似度计算分离性。在3个人造数据集和3个真实数据集上进行对比实验,结果证明该指标的性能优于其他有效性指标。  相似文献   

2.
针对模糊C-均值的现有评价指标没有涉及到数据集的真实几何分布结构和先验信息的问题,为了能准确找到与数据样本自然分布相匹配的簇,提出了一种改进的有效性评价指标VCSC。该指标结合簇内数据平方误差和、隶属度权值及根号权值定义紧凑性度量,结合簇中心距离最小值、隶属度及各簇中心到平均簇中心的距离和定义分离度,结合隶属度范围及样本分布情况定义结合度量。实验结果表明,所提出的指标能够有效地对聚类结果进行评估,能够准确得出数据中最佳的聚类数目。  相似文献   

3.
针对模糊聚类需要预知最佳聚类个数的问题,提出了一种新的基于隶属比的聚类有效性指标Vnew,首先根据经典有效性指标的设计思路,充分考虑数据集合的隶属度矩阵特征和几何空间分布,通过重新定义类内距和类间距的方式,推导出基本的有效性指标;其次,定义隶属比的概念,放大基本有效性指标的计算值;最后,为了避免隶属比对有效性指标造成过分影响而失去意义,引入分类个数进行抑制. 理论分析和仿真实验表明,通过对相同数据集进行分析处理,与经典的XB指标相比Vxb,新指标Vnew具有更高的准确率和可靠性,在类间有重叠数据的情况下也能够做出正确的划分,具有一定的推广价值.  相似文献   

4.
可能性聚类有两大缺陷:一致聚类中心问题和有效性指标失效问题。对于第一个问题,有人提出在目标函数中添加聚类中心排斥项,但这样会引入更多的参数。为此,本文提出了一种改进的可能性聚类算法,较好地解决了这个问题。对于第二个问题,本文通过对隶属度作适当变换,使修正的有效性指标适用于可能性聚类。实验结果表明,该算法的优越性明显,有效性指标估计更为准确。  相似文献   

5.
结合模糊聚类的类内紧致性和类间分离性信息,提出一种新的模糊聚类有效性指标。该指标能够确定由模糊C-均值算法(FCM)所得模糊划分的最优划分和最佳聚类数。在1个人造数据集和4个真实数据集上进行对比实验,结果表明该指标性能的优越性。  相似文献   

6.
一种新聚类算法在基因表达数据分析中的应用   总被引:2,自引:1,他引:1       下载免费PDF全文
自组织特征映射神经网络与层次聚类算法是两种较经典的分析基因表达数据的聚类算法,但由于基因表达数据的复杂性与不稳定性,这两种算法都存在着自身的优劣。因此,在比较两种算法差异性的基础上,创造性地提出了一种新算法,即通过SOM算法对基因表达数据进行聚类,再用层次聚类将每个类对应的神经元权值二次聚类,并将此算法应用在酵母菌基因表达数据中,用实验证明改进算法克服了自组织算法的一些缺陷,提高了基因聚类的效能。  相似文献   

7.
基于小波对比度和神经网络的图像隐写方法   总被引:1,自引:1,他引:0       下载免费PDF全文
为使通信安全在传输过程中提供较大的秘密信息嵌入量,并保持较好的载密图像质量,提出一种基于自组织特征映射神经网络和小波对比度的图像隐写方法。将载体图像分成固定大小的小块,采用小波一级分解并计算其小波对比度,利用自组织特征映射神经网络将小块分为3类,采用模算子技术嵌入秘密信息。实验结果表明,该方法有较大的嵌入量并保持良好的载密图像质量。  相似文献   

8.
为使通信安全在传输过程中提供较大的秘密信息嵌入量,并保持较好的载密图像质量,提出一种基于自组织特征映射神经网络和小波对比度的图像隐写方法。将载体图像分成固定大小的小块,采用小波一级分解并计算其小波对比度,利用自组织特征映射神经网络将小块分为3类,采用模算子技术嵌入秘密信息。实验结果表明,该方法有较大的嵌入量并保持良好的载密图像质量。  相似文献   

9.
模糊聚类有效性的研究进展   总被引:2,自引:1,他引:1  
聚类有效性评价对聚类分析具有重要意义,是聚类分析的瓶颈之一。本文从基于数据集模糊划分的方法和基于数据集几何结构的方法两方面,归纳综述了常用的模糊聚类有效性评价函数,并讨论了模糊聚类最佳类别数的自动确定问题。  相似文献   

10.
基于有效性测度的基因表达数据的模糊聚类分析   总被引:1,自引:0,他引:1  
本文讨论了模糊聚类中的模糊C均值算法和聚类有效性测度。结合基因微阵列的特点,设计并实现了一种基于聚类有效性函数的模糊C均值模型。将该种模型运用于公开的白血病基因表达数据,取得了与实际情况相吻合的实验结果。  相似文献   

11.
数据挖掘技术是电子商务系统不可缺少的重要工具,两者的结合具有长远的发展前途。初探了将一种基于SOM的文本聚类方法应用于一个扩展的电子商务系统的方法,使之用来进行注册客户的聚类挖掘,有利于充分利用网络资源,提高网络系统的使用效率。  相似文献   

12.
聚类是一种经典的数据挖掘技术,它在模式识别、机器学习、人工智能等多个领域得到了广泛的应用.通过聚类分析,目标数据集的深层次结构可以被有效地发掘出来.作为一种常用的划分聚类算法,K-means具有实现简单、能够处理大型数据等优点.然而,受收敛规则的影响,K-means算法仍然存在着对初始类簇中心的选取非常敏感、不能很好地...  相似文献   

13.
为了提供较大的秘密信息嵌入量和保持较好的载密图像质量,提出了一种基于自组织特征映射神经网络和人眼视觉特性的图像密写。该密写方法将对比度和纹理敏感度作为特征向量,并通过自组织特征映射神经网络将像素分为视觉敏感类与视觉不敏感类,将较多秘密信息嵌入属于视觉不敏感类的像素,而将较少秘密信息嵌入属于视觉敏感类的像素。实验结果表明,与SOC算法相比,该算法有更大的嵌入量,并保持了良好的载密图像质量。  相似文献   

14.
提出了一种利用SOM网络输出层可视化的特点进行语音训练的方法。SOM网络能够将输入向量映射到二维平面或曲面上,受试者通过视觉反馈的位置信息,指导其发音行为。为了提高SOM聚类效果,SOM还进行加强训练;讨论了SOM输出层神经元个数对聚类的影响。实验结果表明,提出的利用SOM语音训练方法,直观简单,能够有效地实现“看图说话”。  相似文献   

15.
With the increasing amount of textual information available in electronic form, more powerful methods for exploring, searching, and organizing the available mass of information are needed to cope with this situation. This paper presents the SOMLIb digital library system, built on neural networks to provide text mining capabilities. At its foundation we use the Self-Organizing Map to provide content-based clustering of documents. By using an extended model, i.e. the Growing Hierarchical Self-Organizing Map, we can further detect subject hierarchies in a document collection, with the neural network adapting its size and structure automatically during its unsupervised training process to reflect the topical hierarchy. By mining the weight vector structure of the trained maps our system is able to select keywords describing the various topical clusters. Text mining has to incorporate more than the mere analysis of content. Structural and genre information are key in organizing and locating information. Using color-coding techniques we can integrate a structural analysis of documents based on Self-Organizing Maps into the subject-based clustering relying on metaphor graphics for intuitive visualization. We demonstrate the capabilities of the SOMLib system using collections of articles from various newspapers and magazines.  相似文献   

16.
从集聚分类的角度,实证研究高等学校教育资源状况聚类模型,提出教育资源状况的聚类模型并结合实际进行分类。  相似文献   

17.
混合模式的网络流量分类方法   总被引:2,自引:0,他引:2  
胡婷  王勇  陶晓玲 《计算机应用》2010,30(10):2653-2655
为了更好地满足用户对各类Internet业务服务质量越来越精细的要求,流量分类是网络管理的重要环节之一。通过分析、对比基于端口号匹配、特征字段分析和流统计特征的机器学习分类方法的应用现状及其优缺点,针对单一分类方法存在的分类准确度不高、分类时间长等问题,提出一种混合模式的网络流量分类方案。此方案结合端口号匹配和机器学习分类方法,采用输出结果可视化的自组织映射网络算法实现网络流量在应用层的分类。实验表明,该方案能有效地实现对网络流量应用类型的分类,分类结果可视化效果好。  相似文献   

18.
信息时代,文本信息极其巨大。本文运用一种改进GHSOM 算法进行文本聚类,该算法具有显著的文本聚类 能力,能够将文本的相似性用多种手段表现。实验结果表明改进GHSOM 算法整体上是优于SOM 算法,它的先进性主要体现 在更短的计算时间,并提供更丰富的有序性表达能力。  相似文献   

19.
景波  刘莹  陈耿 《计算机工程与应用》2014,(22):154-157,179
为了实现在海量数据中的审计线索的快速发现,通过数据挖掘FMA算法对被审数据和审计专家经验库进行关联规则快速提取;再利用自组织神经网络改良CLARANS算法对审计专家经验库抽取的规则划分出相似规则群;然后通过对被审单位关联规则集合和专家经验的相似规则群进行相对强弱、趋近率和价值率的比较,最终得到审计线索集合。  相似文献   

20.
文本聚类在文本挖掘和信息检索系统中发挥着重要的作用,而词聚类是文本聚类的基础。提出了一种基于混合聚类的中文词聚类方法,它将层次聚类和概念聚类结合起来,以缩短整个聚类时间。首先对预处理后的词集进行初始聚类,然后从每个类中各取一个出现次数最多的词组成新的词集,最后对该词集进行再聚类。实验表明,这种方法有效降低了中文词聚类的时间复杂度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号