首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 187 毫秒
1.
一种面向入侵检测的半监督聚类算法   总被引:1,自引:1,他引:0  
为了解决传统的入侵检测聚类算法准确率较低这个问题,结合半监督学习的思想,提出了一种面向入侵检测的半监督聚类算法。首先利用样本数据集中的部分标记数据,生成用于初始化聚类的种子集,通过计算样本数据集中标记点与每个类簇中标记点均值的欧氏距离,得到每类的初始聚类中心,实现了入侵检测数据的准确识别。该算法有效地避免了传统聚类算法中初始聚类中心选择的盲目性和随机性,提高了检测率。实验结果表明,在处理入侵检测数据时,该算法能够充分利用少量类标记信息进行半监督学习,较传统的K-means算法聚类效果更好,检测准确率更高。  相似文献   

2.
为了充分利用监督信息指导聚类过程,提出自适应半监督邻域聚类算法(adaptive semi-supervised neighborhood clustering algorithm, SSCAN)。引入监督矩阵与距离度量结合,构造合理的相似矩阵;充分利用监督信息,通过标签信息矩阵与流形正则项结合调整模型,改善聚类效果。在多种数据集进行试验,并与其他聚类算法作对比,结果表明,SSCAN可以充分利用监督信息,提高聚类的准确率。  相似文献   

3.
针对传统的动态文本聚类将描述方式不同的同类文本划分到不同组中;以及聚类类别个数与真实类别数之间差距明显等问题,该文提出了一种半监督语义动态文本聚类算法(SDCS)。该算法以语义表征文本的方式来捕获文本间的语义关系,在聚类过程中动态学习类别语义,让文本能根据语义准确聚类。同时该算法利用半监督聚类的方法对新类的产生进行监督,学习符合实际情况的聚类结果。实验结果表明该文提出的算法是有效可行的。  相似文献   

4.
针对网络入侵检测数据存在大量冗余信息和传统聚类算法对离群点检测不足的问题,提出一种基于主成分分析(principal component analysis, PCA)和半监督聚类的入侵检测算法。首先使用PCA对数据进行特征提取,消除数据间的冗余属性;然后利用少量已标记样本和成对约束信息,通过引入竞争凝聚让系统主动学习,以实现对大量未知样本的检测。在入侵检测数据集和UCI基准数据集上的实验结果表明,该算法能有效提高系统的性能。  相似文献   

5.
一种加权欧氏距离聚类方法   总被引:5,自引:0,他引:5       下载免费PDF全文
聚类是数据挖掘的一种常用技术,最常用的距离度量方法是欧几里得距离,但运用加权欧氏距离需要对数据的实际意义有一定了解,并且要求分析者具有相关的专业知识,而在实际操作中这一点很难保证。本文提出了一种在对数据没有任何先验信息的情况下,如何运用加权欧氏距离有效进行聚类的方法。并结合实例,说明在一定条件下,这种加权欧氏距离聚类方法能显著提高聚类质量。  相似文献   

6.
地震相识别是根据地震数据内部结构,将之划分为不同的地震相结构单元.本文研究基于半监督核均值漂移聚类的地震相自动识别算法,有效结合了半监督学习和核均值漂移聚类的优势,不用人为给定聚类个数,并且在聚类过程中方便引入少量地震相先验信息,从而有效提升地震相识别的准确性.理论数据聚类展示了该算法对地震相中的多个结构单元识别准确度较高.北海F3实际数据聚类结果表明,本文算法可以得到合理的地震相个数,与其它六种聚类算法的结果相比,本算法划分的地震相结构层次分明且能够区分细小微层.  相似文献   

7.
基于分布模型的层次聚类算法   总被引:1,自引:0,他引:1  
提出了一种新的层次聚类算法,先对数据集进行采样,以采样点为中心吸收邻域内的数据点形成子簇,再根据子簇是否相交实现层次聚类。在层次聚类过程中,重新定义了簇与簇之间的距离度量,并以此为基础建立堆结构。利用估计数据点总体分布的思想,证明该算法将逼近最优解。实验结果表明,算法的聚类效果大大优于现有的聚类算法。  相似文献   

8.
为了识别用户端典型用电负荷模式,解决传统聚类算法中仅使用单视角数据致使典型模式识别不全面的问题,提出一种基于多视角网络融合的典型用电负荷模式挖掘方法.采用多视角网络融合算法对三个粒度视角数据进行融合,利用谱聚类算法与共现矩阵度量方法识别典型用电负荷模式,结合教育行业和房地产行业用户基本信息对其用电负荷曲线趋势进行挖掘与分析.结果表明,与单视角数据相比,挖掘出的典型用电负荷模式更为准确且具有较好的鲁棒性,能够结合不同行业特点为电网系统在不同时段采取错峰用电、削峰填谷等措施提供指导.  相似文献   

9.
现有的k-均值聚类算法大都是以距离差异为基础的,而同等重要地依赖所有属性的相似性度量会引起误导.传统的k-均值算法选择的相似性度量通常是欧几里德距离的倒数,这种距离通常涉及所有的特征.而在距离公式中引入一些特征权值后,其聚类结果将依赖于这些权值,从而可以通过调整这些权值优化聚类效果.由于k-均值算法是迭代算法,很难直接确定其权值以优化聚类结果,因此提出了一种通过免疫算法学习权值的方法以改进聚类结果.实验结果显示,该方法确定的权重值在提高聚类效果方面是可行的、有效的.  相似文献   

10.
针对传统半监督支持向量机的高斯核函数无法恰当描述流形数据特性,从而导致流形数据分类精度下降的问题,提出一种基于谱聚类的聚类核半监督支持向量机.利用谱聚类方法在特征向量空间中对原始样本数据进行重新表述,使得在新表述中同一聚类中的样本能够更好地积聚在一起,构建聚类核函数,并进而构造聚类核半监督支持向量机,使样本更好地满足半监督学习必须遵循的聚类假设.研究结果表明:聚类核半监督支持向量机对未标记样本的分类精度高且算法性能稳定,对控制参数的设置不敏感,适于解决流形数据的分类问题.  相似文献   

11.
With the rapid development of WLAN (Wireless Local Area Network) technology, an important target of indoor positioning systems is to improve the positioning accuracy while reducing the online computation. In this paper, it proposes a novel fingerprint positioning algorithm known as semi-supervised affinity propagation clustering based on distance function constraints. We show that by employing affinity propagation techniques, it is able to use a fractional labeled data to adjust similarity matrix of signal space to cluster reference points with high accuracy. The semi-supervised APC uses a combination of machine learning, clustering analysis and fingerprinting algorithm. By collecting data and testing our algorithm in a realistic indoor WLAN environment, the experimental results indicate that the proposed algorithm can improve positioning accuracy while reduce the online localization computation, as compared with the widely used K nearest neighbor and maximum likelihood estimation algorithms.  相似文献   

12.
为了考虑样本与簇之间不确定的归属关系并衍生全局和局部多视角多标签学习的应用范围,提岀一个主动三支聚类下的全局和局部多视角多标签学习算法(global and local multi-view multi-label learning machine with active three-way clustering, GLMVML-ATC)。通过使用主动三支聚类,样本是否归属于一个簇将取决于不确定样本属于核心区域的概率。这使得局部标签关联更可信,能够增强多视角多标签学习机的性能,并加速他们的发展。试验表明,GLMVML-ATC使得分类性能至少提升3%,增加的训练时间不超过7%,更优于典型的多视角、多标签学习机。  相似文献   

13.
为缓解基于半监督学习的水面目标检测对有限标注样本过拟合的问题,提高无标注样本中目标提取的有效性,提出了基于多视图交叉一致性学习的半监督水面目标检测算法。首先,该算法通过数据增强的方式为训练样本生成不同的视图以丰富数据集的多样性;然后,利用所提出的多视图目标判别器为无标注样本在线生成伪标签,有助于提取无标注样本的有效信息;最后,利用所提出的多视图交叉一致性学习使同一目标实例的不同视图的输出实现交叉一致性正则化,以促进检测模型学习判别性的特征从而降低过拟合的风险。在海上和内河数据集上的实验结果表明:文中所提算法能够提高特征提取的判别性,对多类别的水面目标检测精度达到91.0%,比全监督检测算法提高了18.7%,比其他半监督检测算法提高了3.8%以上;在检测速度上,该算法达到13.1帧/s,基本满足实时性要求。所提算法通过多视图交叉一致性学习提高特征的判别性和缓解检测模型的过拟合风险,有助于提高半监督水面目标检测的性能。  相似文献   

14.
为了充分挖掘成对约束所隐含的信息来指导数据降维和数据聚类,提出一种基于加权成对约束投影的半监督聚类方法.该方法构造成对约束信息的k最近邻集并扩充成对约束集,分析成对约束实例包含的信息量并构造权系数矩阵,在加权成对约束信息的指导下求得投影矩阵,通过投影矩阵将样本数据投影到低维空间,使类内各点紧密分布,类间各点分散分布.同时,通过一种新的评价函数对k均值聚类算法进行改进,能够在尽量不违反成对约束的情况下优化聚类性能,实验结果表明,与现有半监督降维聚类算法相比,新方法能以较低的开销对高维数据进行聚类.  相似文献   

15.
传统的基于内容的三维模型检索的相似性度量方法主要借鉴二维图像检索中所采用的距离度量算法,达到比较两三维模型相似度的目的,该做法限制了模型间匹配的广度.针对这种单核匹配的限制,提出了一种新的多核匹配方法.利用图论中两点间的最短距离的思想,得出两模型最相似那他们的距离最短,因此查询样本跟匹配的样本存在的通路上的模型节点能影响他们的相似度,这样就提高了匹配的广度和精度.同时在已有的特征提取基础上,把标签繁衍算法应用到最短距离求解中,并将基于实例学习的K近邻方法引入到模型匹配算法中,实现了半监督学习,提高了系统的查准率.  相似文献   

16.
多视图模糊聚类综合了数据的不同表示,虽然能够产生更全面、宏观的聚类结果,但是容易受到噪声干扰。为了提高抵抗噪声的能力,提出了一种多视图模糊聚类算法。该算法同时继承了多视图聚类和模糊紧致性分离性聚类算法的优点,能够根据不同视图的重要性协同聚类,同时增强算法的鲁棒性。为了验证算法的有效性,选取4个多视图数据集进行了实验。实验结果表明,该算法不仅能够获得较高的聚类准确率,而且能有效地降低噪声数据对聚类结果的影响。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号