首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
针对多维数据集异常数据检测过程中未对多维数据集进行降维处理,导致多维数据集中异常数据检测精度较低、误检率较高、检测时间较长的问题,提出一种基于谱聚类的多维数据集异常数据检测方法。首先,通过拉普拉斯矩阵对多维数据集中的数据进行聚类,初步分类数据;其次,采用局部线性嵌入(LLE)算法对分类后的数据进行降维处理,用特征向量表达高维数据集,去除多维数据集中的冗余信息;最后,将处理后的多维数据集输入到支持向量机模型中,根据回归估计值的计算,完成异常数据的检测。实验结果表明,本文算法进行多维数据集中异常数据检测的精度更高、误检率更低,检测时间较短。  相似文献   

2.
自动确定聚类数和海量数据的处理是谱聚类的关键问题。该文提出了一种能自动确定类个数的谱聚类算法,该算法通过数据亲合矩阵的谱分解得到一系列特征值,再利用特征值差值分析来自动确定类个数。并通过对复杂分布数据和UCI数据库中的数据集进行实验,结果表明该算法不仅能找到合适的类个数,并且有较好的分类准确性。  相似文献   

3.
针对现有聚类集成谱算法聚类结果不稳定的问题,引入近邻传播聚类思想,设计了基于近邻传播的聚类集成谱算法(APCESA).该算法先由聚类集成和谱分得到空间结构相对简单的文本低维嵌入,然后通过近邻传播算法得到最终的聚类结果.在谱分解过程中,采用矩阵变换方法,避免了谱算法中特征值分解的高昂计算代价.对真实文本数据集的实验结果表明,所提算法比对比算法聚类更稳定,且聚类结果的NMI值和ANMI值均高于对比算法.  相似文献   

4.
谱聚类是近年来一类具有较好应用前景的聚类方法。本文将独立成分分析引入到传统的谱聚类方法中,提出了一种基于独立成分分析的谱聚类算法。利用独立成分析作为预处理,消除了数据内的冗余信息,使得待聚类数据点在高阶统计量的意义下相互独立。文中对比实验证明了该方法的有效性。  相似文献   

5.
有向网络社团结构的识别对于理解复杂系统的结构特性和动力学特性都有着重要的意义。提出了一种基于拉普拉斯矩阵多重特征向量的有向网络社团结构划分算法,该算法利用有向网络拉普拉斯矩阵的前c个较小特征值所对应的特征向量来划分有向网络的社团结构。在人工数据和实证数据上与模块度的谱优化算法和模拟退火算法做了对比实验。实验结果表明,当社团结构明显时,该算法的归一化互信息指标的值接近于1。当社团结构不明显时,该算法所取得的效果也优于谱优化和模拟退火算法。与这两种算法相比,在实证网络上模块度Q值也可以提高17.28%和19.21%。该文工作对于理解有向网络上拉普拉斯矩阵的多重特征向量与网络的社团结构的关系具有十分重要的意义。  相似文献   

6.
改进了传统的谱聚类算法,并优化了初始聚类中心的选择方法。传统的谱聚类算法虽然具有算法复杂度较低、适用范围广等特点,但受高斯核函数尺度参数影响较大。设计的算法通过引入万有引力模型进行相似性度量,设计了基于引力的相似性度量方法,以此消除尺度参数的影响;另外,提出基于密度与距离乘积的初始聚类中心选取方法,优化了初始聚类中心的选择。在UCI基准数据集上的实验表明,改进的算法消除了尺度参数σ影响的同时,也达到了比较好的NMI指标和Accuracy指标。最后,使用改进的算法设计了基于微博用户的群组探测方法,取得了较为理想的用户群组划分结果。  相似文献   

7.
聚类分析的一个重要应用就是图像识别,谱聚类因为比传统的聚类方法更高效而迅速被广泛运用到图像处理中。谱聚类算法其中一个重要的步骤是构造一个合适的相似矩阵,本文提出一种基于共享近邻重要性的自适应谱聚类算法且应用到数字手写图像识别中,与自适应谱聚类算法做比较试验,表明谱聚类算法能取得较好的识别结果。  相似文献   

8.
提出融入无监督聚类的地震易损性分析方法-将隶属度矩阵的近似正交约束与谱聚类相结合的平衡化谱聚类算法.该算法基于图Laplacian矩阵的重表示矩阵,从给定的所有地震记录中筛选出具有代表性的样本子集,缓解由所选地震动强度指标过多引起的“维数灾难”问题;并通过隶属度矩阵的近似正交约束,解决应用传统谱聚类算法筛选地震波时产生的“均匀效应”问题.以实际工程为例,开展以“拱坝-地基结构”为整体体系的地震易损性研究,分别建立以15条规范反应谱样本、109条整体样本为参照基准的地震易损性模型进行聚类算法效果验证.结果表明,聚类算法筛选的样本与整体样本的地震易损性结果接近,在损伤体积比、坝顶位移、横缝最大开度性能指标下,两者易损性概率最大误差分别为4.39%、3.84%、6.64%,误差不超过5%的最小概率分别为92.24%、99.19%、81.75%,表明该算法在筛选典型地震样本方面的有效性.  相似文献   

9.
为解决核模糊相似性度量谱聚类算法的样本点降噪问题,优化聚类效果和稳定性,本文从分析异常点分布特性出发,引入局部异常因子(LOF)算法,提出聚类中心候选对象的概念,过滤数据集的噪声数据,从而优化初始聚类中心的计算,突出正常样本点在聚类中心调整中的影响力,使聚类算法更易于得出准确的聚类结果. 同时提出一种局部过滤因子以修正相似性度量的方法,该方法通过放大正常数据之间的权值、缩小正常数据与噪声数据间的权值,使优化后的核模糊谱聚类算法大大降低对异常点的敏感度. 算法有效性实验和算法稳定性实验表明:该方法对相似性度量修正的有效性使核模糊谱聚类算法更为稳定和鲁棒.  相似文献   

10.
为使多路谱聚类方法对复杂结构数据集有效地聚类,根据矩阵扰动理论,利用局部近邻关系更新谱聚类算法(NJW)中的初始相似度矩阵,得到最终的亲和矩阵.理论分析表明,数据集可划分时,该矩阵是理想块矩阵或接近理想块矩阵,保证了本文算法聚类划分的正确性.将本文算法和基于路径的谱聚类、密度敏感的谱聚类以及基于流平面排序的谱聚类进行了比较,结果表明,本文算法在数据集具有复杂分布结构时可以确定聚类个数,得到正确的聚类结果.进一步将本文算法用于真实数据集上的聚类分析,表明本文算法是有效的.  相似文献   

11.
自适应谱聚类算法研究   总被引:4,自引:0,他引:4  
谱聚类能识别出在原空间中线性不可分的聚类, 且其效果优于传统聚类算法.谱聚类要想获得好的效果必须选择一个合适的尺度参数,本文在传统谱聚类算法的基础上引入类似核选取的技巧,提出了一个能自动选取该尺度参数的自适应谱聚类算法.将该算法和现有的谱聚类参数选择算法作了比较,在人工数据集和UCI数据集上的实验表明,自适应谱聚类算法在很多情况下优于其它参数选择算法.  相似文献   

12.
为了克服谱聚类图象分割方法性能容易受到图像大小和相似性测度的影响,提出一种基于灰度和空间特性的谱聚类图像分割算法。该算法不对图像中的像素之间建立相似性,而是利用各个像素的灰度在图像中的分布信息和像素点的空间邻接信息建立灰度之间的相似关系,通过对图像中灰度的分类进而获得原始图像的分割结果。因此,该算法不会受到图像大小的限制,无论对于多大的图像,相似性矩阵的大小都是小于等于256×256。Berke-ley基准图像数据集上的分割仿真实验验证了该方法的有效性。  相似文献   

13.
为了降低谱聚类算法尺度参数对分类结果的影响,避免Nystrm逼近导致的分类结果不稳定,提出了一种基于谱聚类集成的极化合成孔径雷达(SAR)地物分类方法.首先,利用像素间的空间关系和极化信息,将基于相干矩阵Wishart距离的相似性测度和基于极化特征矢量欧氏距离的相似性测度相结合,引入马尔可夫随机场势函数,构造谱聚类的相似性矩阵;然后,采用基于Nystrm逼近的谱聚类实现极化SAR数据的单次谱分类;最后,采用集成策略完成对极化SAR图像的地物分类.实验结果表明,该算法提高了分类精度,区域一致性保持较好,且分类结果稳定.  相似文献   

14.
以多边形特征点提取为基础,构造特征点的星树,通过修改星树图谱域系数中差值最小的一对嵌入水印信息,在水印提取阶段能够无损恢复原始矢量地图数据.实验结果表明该水印方案严格可逆,具有较好的隐蔽性及抗图形简化能力,是一种用于二维矢量地图版权保护的实用算法.  相似文献   

15.
针对原始谱聚类算法初始化敏感的缺点,提出了一种基于联合模型的初始化独立谱聚类算法并将其用于图像分割.通过引入联合模型可以充分利用待聚类数据所包含的空间邻近信息和特征相似性信息,得到更精确的聚类结果;通过引入K-调和平均算法克服了原始谱聚类算法对初始化的敏感性,从而得到更稳定的聚类性能.最后,通过对纹理图像和合成孔径雷达图像分割验证了新算法的有效性.  相似文献   

16.
针对聚类数不确定的高维、大规模数据聚类问题,提出以粒子群优化算法为基础、引入克隆选择算子的聚类分析算法。该算法利用粒子群的优化搜索机制搜索聚类中心向量,并根据适应度高低控制粒子的克隆数量和变异幅度,达到有效避免陷入局部最优的目的,并能克服传统聚类算法对初始值敏感的缺点,提高了算法的稳定性。仿真实验结果表明,该算法不仅能正确得出聚类簇数,而且聚类正确率较对比算法提高了至少7.0%。  相似文献   

17.
针对目前谱聚类算法的相似图包含较多错误社区信息的问题,引入了概率矩阵的概念,提出了一种改进的谱聚类社区发现算法。该算法首先利用马尔可夫过程计算节点间的转移概率,并基于转移概率构建复杂网络的概率矩阵;然后以均值概率矩阵重新构造相似图;最后通过优化归一化切割函数实现社区划分。采用人工网络和现实网络与其他典型算法进行对比实验,实验结果表明,该算法能够更加精准地划分社区,具有更加良好的聚类性能。  相似文献   

18.
将主元分析(principal component analysis, PCA)模型相似度(以下简称PCA相似度)和谱聚类(spectral clustering)算法相结合,并用于基于高炉历史数据挖掘的炉况工作点变化的分析。利用PCA相似度与距离相似度的加权来衡量滑窗数据集之间的相似度,进一步将数据集的聚类问题转化为图的最优划分问题,通过谱聚类得到聚类结果。该方法降低了高炉工作点漂移的影响,能够有效稳定的实现高炉炉况工作点的聚类。基于现场历史数据的离线测试表明:与已有的基于PCA相似度和k-means聚类的算法对比,本研究可以更加有效区分炉况工作点的跳变。  相似文献   

19.
针对物联网环境下实时数据挖掘中资源约束的特点,分析了快速有效地挖掘抽取知识的方法。在K-means算法的基础上,结合RA-Cluster算法,提出了ARRA-Kmeans聚类算法。并基于环境资源约束和时间约束的特点,引入自适应聚类方法和滑动窗口技术,对网络节点的实时数据进行挖掘。实验结果表明,随着流数据量的增大,ARRA-Kmeans算法在处理实时动态的数据时具有较好的效果,聚类精度较高,处理时间较快。  相似文献   

20.
基于模糊聚类表征的音频例子检索及相关反馈   总被引:10,自引:0,他引:10  
避免先前基于例子的音频检索要按照监督机制训练不同类别的复杂的音频模板,直接从原始音频流中提取压缩域特征,使用时空约束机制进行压缩域特征的模糊聚类,用聚类结果的质心来表征整个音频例子,基于聚类质心完成相似度匹配,实现基于非监督机制的音频例子快速检索.并在检索过程中引入相关反馈,根据用户对检索结果的相关反馈调整检索结果,使其与用户的感官相似一致.实验结果表明,此种方法可以达到快速检索的效果,检索准确率可达85%以上.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号