首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 250 毫秒
1.
针对快速搜索发现密度峰值聚类(CFSFDP)算法存在的密度中心选择不方便、聚类精度不高的问题,提出基于马氏距离的自动搜索发现密度峰值的聚类算法。该算法将马氏距离引入距离测定中,提高了聚类精度;提出聚类中心判定参数γ,自动获得了聚类中心。采集航空发动机转子模拟振动信号实验数据,分别采用传统CFSFDP算法、改进后的CFSFDP算法、K均值聚类和模糊C均值聚类进行分析,结果表明,所提算法能够很好地改善聚类精度,其聚类精度相比K均值聚类和模糊C均值聚类有很大优势,且在故障特征的分类与识别上均优于其他两种算法。  相似文献   

2.
针对模糊C均值(FCM)算法聚类结果对初始中心点敏感以及聚类过程中没有考虑到不同密度样本点在聚类过程中影响力不同的缺陷,提出了一种密度峰值和样本点空间邻域信息优化的FCM算法。改进后的算法选择数据集中具有局部密度峰值的样本点或者局部密度较大的样本点作为初始聚类中心,充分考虑样本点邻域之间的关系,增加局部密度值大的样本点在聚类中心迭代计算过程中的影响力,从而达到优化FCM算法聚类效果的目的。理论分析和在人造数据集、加州大学欧文分校(UCI)机器学习数据库中真实数据上的实验结果表明,改进后算法的抗噪性、聚类效果和全局收敛能力均优于传统FCM算法。  相似文献   

3.
针对大多基于聚类的离群点检测算法往往需要人工输入参数,对于不同的数据集很难选择一个合适参数的问题,将无参数的基于自然邻居的离群点检测算法的自然邻居搜索算法和密度峰值聚类算法相结合,提出一种基于聚类离群因子和相互密度的离群点检测算法。该算法使用相互密度和γ密度构造决策图,将γ密度异常大的样本点作为聚类中心进行聚类,最后根据聚类的离群因子找出离群聚类边界检测离群点,该算法不需要人工输入参数。在模拟数据集和真实数据集下进行了实验,证明了所提算法能很好地进行聚类和离群数据的挖掘。  相似文献   

4.
考虑到现有费舍尔判别分析(FDA)及其改进算法无法同时有效利用有标签数据和无标签数据进行学习,提出一种基于密度峰值聚类的正则化局部费舍尔判别分析(DPC-RLFDA)算法。该算法首先利用密度峰值聚类算法得到的伪标签构造两个正则化项来规范局部FDA的类间散度矩阵和类内散度矩阵;然后通过求解目标函数得到最优投影向量。此外,为适用于非线性非高斯分布数据集,提出了基于核的DPC-RLFDA。在人工数据集和UCI数据集上的实验结果表明,与FDA及其改进算法相比,所提算法的判别性能得到了显著提升。  相似文献   

5.
针对云制造平台海量多样的服务资源分类界限模糊的问题,分析了云服务和制造资源之间的关系,提出云制造下混合式资源服务聚集模型。此外,文章基于k-means聚类算法建立了聚类有效性评估函数;针对k-means聚类算法对初始聚簇中心敏感易陷入局部最优的缺点,引入蛙跳算法确定初始聚簇中心,利用反向解扩大初始蛙群的搜索范围,结合最优解均值改进族群最差蛙的优化,提高族群的信息共享能力,结合改进后的蛙跳算法和k-means迭代,提出一种基于蛙跳算法改进的k-means聚类算法。最后,以两种数据集和云平台上同类机床资源为例,验证了所提聚类算法的有效性和可行性。  相似文献   

6.
针对传统的窑炉异常检测方法易受主观因素干扰且存在异常冗余报错的情况,提出一种基于人工蜂群算法的密度峰值聚类(ABC-DPC)的玻璃窑炉能耗异常检测方法。该方法针对密度峰值聚类存在人工设定参数和无法自动划分簇中心和离群点的不足,以人工蜂群算法实现了截断距离的自适应优选过程,并设立离群系数策略以实现自动划分簇中心和离群点的功能。研究了玻璃窑炉的分层能耗模型,并基于此导出能耗特征值,然后应用ABC-DPC算法实现窑炉异常能耗的聚类检测。实验结果表明,所提出算法较于经典聚类算法,检测准确率较高,而且能实时地检测窑炉的能耗异常状况。  相似文献   

7.
针对大数据环境下并行谱聚类算法存在的节点负载不均衡、冗余计算、矩阵相乘时间开销大以及初始簇中心敏感等问题,提出了基于KD(k-dimension)树和混沌蜉蝣优化算法的并行谱聚类算法(PSC-MO)。首先,提出基于采样的KD-tree数据分区策略(DPS)划分数据,保证了节点间负载均衡;其次,在构建稀疏相似矩阵过程中,提出优化的分区分配策略(OPA)和基于三角不等式的KD树剪枝策略以进行跨分区的t近邻搜索,避免了过多的冗余计算;然后,提出正规化定理,通过元素对应相乘的方式代替矩阵相乘以优化Laplacian矩阵正规化过程,有效地减少了时间开销;最后,提出混沌蜉蝣优化算法(CMO),得到最佳位置作为初始簇中心后进行k-means并行聚类,解决了算法对初始簇中心敏感的问题。实验表明,PSC-MO算法不但具有良好的聚类效果,而且在大规模数据集上表现出了良好的数据和系统可扩展性。  相似文献   

8.
基于邻居搜索和模糊C均值方法,提出了一种新的鲁棒的聚类算法(NSFA)。该算法采用邻居搜索方法遍历相邻的数据,依据搜索距离确定聚类数目。NSFA方法引入内核函数,以提高其对噪声和异常点的鲁棒性。为了验证算法的鲁棒性,实验采用读取加速度计的数据,对比实验结果表明所提出的算法明显提高数据集的聚类性能,清晰划分加速度的变化趋势。  相似文献   

9.
针对常用聚类算法对复杂分布数据难以有效聚类的问题,把网络分析技术与基于代价函数最优的聚类技术相结合,提出一种新颖的迭代可调节网络聚类算法。该算法采用网络的思想建立样本空间模型,把数据聚类问题转化为基于节点生长连接的网络分析问题;并设计了可调节的节点间相似关系测度和相应的聚类准则来构建节点间邻域搜索及节点生长操作;通过改变调节系数来实现网络节点间连接关系的整体调节。新算法能够在无需预先设定簇数目的情况下,自动获得簇的数目和样本数据的分布位置。采用4组不同样本分布的人工数据集聚类和往复压缩机气阀泄漏故障诊断试验,对比测试了新算法与K均值算法(KM)的性能,结果表明迭代可调节网络聚类算法可实现对复杂分布的流形数据聚类,在准确率及自动处理程度性能指标上明显优于常用的KM算法。  相似文献   

10.
何健  张聪 《制造业自动化》2012,34(4):1-3,19
遗传算法具有快速良好的全局搜索能力,而蚁群聚类算法具有良好的分布式并行性和正反馈能力.K-Means、基于密度的聚类是常见的基于分割的聚类方法,它在处理空间数据时具有快速、有效处理噪声点和发现任意形状的聚类等优点.聚类算法概述聚类分析是数据挖掘领域中的一项重要的研究课题,本文主要研究是将遗传算法,蚂蚁算法、K-Means算法、密度思想结合在一起,提出了一种基于密度蚂蚁思想的K-Means算法,采用密度函数法的多中心聚类并结合小类合并运算的聚类结果明显优于K-means的聚类结果,提高了聚类的质量.再结合密度思想,使蚂蚁有选择地遍历,提高了算法效率,并克服了基于密度的算法不能发现任意形状聚类的问题.  相似文献   

11.
多均值聚类算法假设每个类拥有多个子类,通过求解优化问题的方式来求解每个样本子类的划分和最终类簇的划分.该算法弥补了K-均值算法在非球数据集上的劣势,取得了较好的聚类效果,但是该算法无法被运用到多视图数据集上.本文提出了一种多视图K-多均值聚类算法,保留了K-多均值设置多个子类的设计,引入了视图权重参数,将目标聚类数作为限制条件,通过求解最优问题获得最终的类簇.将本文提出的算法与流行的多视图聚类算法进行对比实验,证明了本文算法的优越性.  相似文献   

12.
为获取散乱点集的拓扑邻域数据,提出一种基于均值逆向漂移的自适应迭代搜索查询算法,基于R*树动态空间索引,采用动态扩展空心球k邻域查询算法快速获取目标样点的拓扑邻域参考数据,根据邻域查询与点集密度分布的关系,采用核密度估计描述点集的分布规律,利用均值漂移算法计算得到能够反映散乱点集局部分布特征的均值漂移矢量和均值点,将邻域搜索区域沿逆向均值漂移矢量移动进行邻域查询并实时更新样点的拓扑邻域参考数据,进而完成拓扑邻域查询的均值逆向漂移迭代计算,最终实现样点拓扑邻域数据的自适应搜索查询。试验表明,该算法可快速获取复杂型面均匀或非均匀采样点集的邻域数据,查询结果包含Voronoi邻域及其他有效邻域参考数据,能更好地反映散乱点集局部型面特征。  相似文献   

13.
针对设计理性的自动聚类问题,提出一种基于密度峰值法的设计理性聚类方法。该方法结合设计理性的语义特点,利用单元本词汇频率/单元本频率值方法将设计理性转化为特征向量。然后基于密度峰值法求出每个特征向量的局部密度和距离两个参数,绘制决策图确定聚类中心,并将其余的数据指派到相应所属的类别中。针对密度峰值法在处理密度分布不均的数据时聚类效果差的问题,利用K最近邻方法定义动态截断距离来改进局部密度函数。以某机械设计团队的55个设计理性为例验证了所提方法的有效性。  相似文献   

14.
变频器设备机理复杂、设备监测数据异常样本少,导致在实际应用中基于经验和基于模型的异常检测方法操作性难、常规的数据驱动方法可行性差。针对上述问题,结合密度峰值聚类与时序运行数据的转移特点,提出一种基于大数据分析的变频器异常检测方法。该方法首先通过密度峰值聚类将运行数据聚类,然后将时序过程数据在不同类簇间的动态变化规律用概率表示,并基于聚类结果和转移概率提出异常检测体系框架,最后通过异常案例验证该方法的有效性,表明该方法能够正确识别变频器异常行为。  相似文献   

15.
为提高故障辨识准确率,提出一种专用于故障数据集自适应确定聚类类别数目的非参数加权特征提取(NWFE)和模糊核C-均值(KFCM)相结合的算法。以一个双跨度转子实验台作为实验研究对象,在将核函数与模糊C-均值方法相结合的基础上,采用NWFE算法中加权聚类中心的计算实现了为每个样本分配不同的权值,并引入聚类评价指标PBMF自适应地确定出最佳聚类数目。用Iris经典数据集对算法进行验证表明,所提算法能够克服传统算法中存在的同等对待不同样本特征和完全靠先验知识确定聚类数目的弊端。将该算法应用到转子实验台模拟故障的特征数据集中,进一步表明了其在转子故障数据集聚类分析中的有效性和实用性。  相似文献   

16.
给出一个基于模糊c-平均(FCM)算法的零件簇聚类分析的过程模型来描述分析过程;构造了适合于零件簇聚类分析的FCM算法,该方法考虑了零件簇对象特征之间的模糊关系和各零件对象特征聚类中心之间的距离,无需设计权重系数;通过实例进行了聚类分析,并与模糊聚类和k-平均聚类两种方法进行比较,证明该FCM算法是有效的。  相似文献   

17.
针对实际应用中三维模型数据集的模型分类管理、检索聚类预处理等聚类问题,提出了一种基于划分方法的无监督聚类模型。该模型通过以傅里叶矩不变算法为基础的特征提取算法,综合运用了现有聚类算法,将特征提取和聚类计算有效结合起来,充分考虑了聚类模型数据格式的敏感性问题。计算结果表明,该方法对有一定类结构的数据集在有整体聚类效果的情况下有一定的局部最优性。  相似文献   

18.
为快速、精确地从云制造平台资源池中搜索到满足用户需求的资源,实现资源与需求的高效匹配,提出了一种资源需求高效匹配策略。首先,建立了资源与需求的形式化描述模型,在此基础上,采用改进的K-means聚类算法按基本信息进行聚类,对云服务池中的资源进行预处理,形成多个资源簇;其次,计算用户需求与各资源簇聚类中心基本信息的相似度,确立备选资源簇;最后,再分别从资源的状态信息、功能信息和服务信息3个方面对备选资源簇中的备选资源进行筛选匹配。实例分析和研究结果表明:与已有的匹配方法相比,该方法在保持较高匹配精度的同时具有更高的匹配效率。  相似文献   

19.
针对汽车零部件质检数据存在合格品与不合格品数量不平衡的问题,提出了基于密度聚类与多工序制造特征的MCDC-MF-SMOTE质检数据过采样方法.先对少数类(不合格)与多数类(合格)样本分别进行密度聚类,再对多工序制造数据和类簇样本分布进行过采样权重计算;根据设定的过采样比和类簇权重,在少数类簇中进行过采样数据生成.使用M...  相似文献   

20.
基于聚类和距离的大数据集离群点检测算法   总被引:1,自引:0,他引:1  
针对已有的基于距离的离群点检测算法在大数据集上扩展性差的问题,提出了基于聚类和距离混合的大数据集离群检测算法.算法第一阶段采用层次聚类和k-means混合的层次k-means算法对数据进行聚类,并按照一个启发式规则对其进行排序.第二阶段在聚类的结果上采用嵌套循环算法进行离群检测,并通过两个剪枝规则进行高效舅枝,减少了离群检测时数据点之间距离计算的次数.理论分析和实验结果证明了算法的可行性和效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号