首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
随着文本数据的快速积累,文本自动分析成为管理和利用海量文本数据的重要手段。其中,文本聚类是文本分析的基本任务之一。本文着重介绍文本分析与谱聚类的研究进展,阐述目前在文本分析中应用谱聚类技术的主要方法,旨在为文本分析中谱聚类方法的应用提供引导作用。  相似文献   

2.
边介数聚类算法在肿瘤基因表达谱中的应用   总被引:1,自引:1,他引:0  
基于肿瘤基因表达谱研究了肿瘤相关基因及其功能模块的聚类算法,同时利用模块度评价了算法的有效性.通过与层次聚类算法的比较,证明边介数聚类算法在肿瘤基因功能模块聚类方面具有一定的有效性和实用性.以人结肠癌基因表达谱为研究对象,应用边介数聚类算法将158个从2万多个原始数据中提取的特征基因聚成7种功能类.通过GO数据库检索进一步证明这7类基因具有明确的生物学功能和意义.  相似文献   

3.
Affinitypropagation(AP)聚类算法是通过消息传递实现聚类的,不需要事先指定聚类数目.对于规模较大的数据集,AP聚类是一种快速、有效的聚类方法,这是其他传统聚类方法所不能及的,如K—centers方法.研究了AP算法的原理和步骤,通过实验,证明了AP聚类算法的实用性和有效性.  相似文献   

4.
谱聚类是近年来一类具有较好应用前景的聚类方法。本文将独立成分分析引入到传统的谱聚类方法中,提出了一种基于独立成分分析的谱聚类算法。利用独立成分析作为预处理,消除了数据内的冗余信息,使得待聚类数据点在高阶统计量的意义下相互独立。文中对比实验证明了该方法的有效性。  相似文献   

5.
针对电力系统二次设备工作中,人工校核继电保护压板位置、描述和状态,工作量大、易出错、效率低等问题,提出了基于图像识别技术和模型聚类匹配算法的继电保护压板自动识别与校核方法.该方法首先运用图像识别技术获得压板设备、文字标签的特征信息,然后采用图像模型聚类匹配算法重新排列压板顺序得到其具体位置信息,再进行压板设备与文字关联...  相似文献   

6.
自适应谱聚类算法研究   总被引:4,自引:0,他引:4  
谱聚类能识别出在原空间中线性不可分的聚类, 且其效果优于传统聚类算法.谱聚类要想获得好的效果必须选择一个合适的尺度参数,本文在传统谱聚类算法的基础上引入类似核选取的技巧,提出了一个能自动选取该尺度参数的自适应谱聚类算法.将该算法和现有的谱聚类参数选择算法作了比较,在人工数据集和UCI数据集上的实验表明,自适应谱聚类算法在很多情况下优于其它参数选择算法.  相似文献   

7.
针对现有聚类集成谱算法聚类结果不稳定的问题,引入近邻传播聚类思想,设计了基于近邻传播的聚类集成谱算法(APCESA).该算法先由聚类集成和谱分得到空间结构相对简单的文本低维嵌入,然后通过近邻传播算法得到最终的聚类结果.在谱分解过程中,采用矩阵变换方法,避免了谱算法中特征值分解的高昂计算代价.对真实文本数据集的实验结果表明,所提算法比对比算法聚类更稳定,且聚类结果的NMI值和ANMI值均高于对比算法.  相似文献   

8.
针对谱聚类算法对图像分割效果差强人意的特点,研究了一种改进的Nystrm算法进行谱聚类图像分割,使谱聚类算法应用于图像分割的效果有所改善。该算法首先对图像进行预处理,变换图像的分布数据空间,再分别计算对选定样本空间的数据间以及样本与其他空间的数据间的距离矩阵,并转化为相似矩阵;然后对相似矩阵正交化并且特征分解,进行K-Means聚类;最后将聚类结果进行后期处理。通过实验验证了该算法的有效性。  相似文献   

9.
自动确定聚类数和海量数据的处理是谱聚类的关键问题。该文提出了一种能自动确定类个数的谱聚类算法,该算法通过数据亲合矩阵的谱分解得到一系列特征值,再利用特征值差值分析来自动确定类个数。并通过对复杂分布数据和UCI数据库中的数据集进行实验,结果表明该算法不仅能找到合适的类个数,并且有较好的分类准确性。  相似文献   

10.
改进了传统的谱聚类算法,并优化了初始聚类中心的选择方法。传统的谱聚类算法虽然具有算法复杂度较低、适用范围广等特点,但受高斯核函数尺度参数影响较大。设计的算法通过引入万有引力模型进行相似性度量,设计了基于引力的相似性度量方法,以此消除尺度参数的影响;另外,提出基于密度与距离乘积的初始聚类中心选取方法,优化了初始聚类中心的选择。在UCI基准数据集上的实验表明,改进的算法消除了尺度参数σ影响的同时,也达到了比较好的NMI指标和Accuracy指标。最后,使用改进的算法设计了基于微博用户的群组探测方法,取得了较为理想的用户群组划分结果。  相似文献   

11.
传统的边缘检测算子是基于梯度函数的边缘检测算法,没有考虑图像特征的多样性.针对传统算法的不足,结合边缘方向能量模型和谱聚类算法,提出了一个新的边缘检测算法.利用航空影像进行验证,实验结果表明该方法检测影像边缘的结果比较理想.  相似文献   

12.
图像压缩的关键在于对图像中相似取样点的选择和处理.用基于图像像素的遗传聚类算法对3D图像分析选择样本,通过FCM算法得到一个有序的像素序列,然后进行聚类获得压缩.实验表明,运用模糊聚类分析法能够有效降低压缩算法的复杂度,并能达到预期的图像压缩效果.  相似文献   

13.
为了有效利用少量先验信息提高多视角数据聚类效果,提出了一种基于距离度量学习的半监督多视角谱聚类算法(简称ML-SMC)。首先,利用距离度量学习引入先验信息,将多视角数据映射到反映先验约束条件的空间.然后,根据相似性构造每个视角的视图,将多视角聚类问题转化为最小正则割的图划分问题。实验结果表明:ML-SMC算法聚类结果的精度优于3种经典的多视角聚类算法和4种半监督单视角聚类算法。并且通过利用少量先验信息ML-SMC算法能够有效提高聚类效果。  相似文献   

14.
为使多路谱聚类方法对复杂结构数据集有效地聚类,根据矩阵扰动理论,利用局部近邻关系更新谱聚类算法(NJW)中的初始相似度矩阵,得到最终的亲和矩阵.理论分析表明,数据集可划分时,该矩阵是理想块矩阵或接近理想块矩阵,保证了本文算法聚类划分的正确性.将本文算法和基于路径的谱聚类、密度敏感的谱聚类以及基于流平面排序的谱聚类进行了比较,结果表明,本文算法在数据集具有复杂分布结构时可以确定聚类个数,得到正确的聚类结果.进一步将本文算法用于真实数据集上的聚类分析,表明本文算法是有效的.  相似文献   

15.
基于统计特征聚类原理的图像识别技术   总被引:8,自引:0,他引:8  
提出了基于模糊聚类原理的图像统计特征识别技术。通过分析象素灰度矩阵信息,提取出图像独立的统计特征量,建立起相应的图像统计特征模型空间Ω。由此,计算出各图像类的模糊相似系数矩阵,再运用聚类分析的传递闭包法将其改造成为模糊等价矩阵,划分出图像等价类,进而实现对目标图像的识别。实验结果表明,该方法能获得很好的图像识别效果。  相似文献   

16.
在电力系统中应用图像识别技术有利于及时进行设备维护和故障排除,为开展设备状态检修,建设智能电网奠定基础。文章介绍了电力系统图像识别技术及其应用现状,说明了一般的图像识别过程。通过SF6泄漏激光成像仪和红外热像仪的应用,建立后台处理中心,把图像处理、视频分析结合起来,提供一个基于图像和视频分析的辅助诊断平台,实现设备故障诊断工作规范化。  相似文献   

17.
利用矩阵的相似变换,研究了简单连通图的谱半径的可达下界,得到一个新的下界ρ(G)≥δ1+t-s+√(s+t-δ1)2+4s(δ2-t)/2,等号成立当且仅当G=~G1 G2,其中G1为n-i阶(δ1-s)-正则图,G2为i阶t-正则图。  相似文献   

18.
聚类算法是数字识别的热点研究技术之一,是一种寻找特征相似的聚合类非监督学习的方法.采用聚类法在vc++6.0环境进行手写体数字识别系统设计.通过图像的分割与特征提取,模式相似性测量和聚类的分析完成识别工作.结果表明基于试探的聚类识别算法的手写数字识别系统识别率达到100%,满足实际应用需求.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号