共查询到20条相似文献,搜索用时 250 毫秒
1.
针对快速搜索发现密度峰值聚类(CFSFDP)算法存在的密度中心选择不方便、聚类精度不高的问题,提出基于马氏距离的自动搜索发现密度峰值的聚类算法。该算法将马氏距离引入距离测定中,提高了聚类精度;提出聚类中心判定参数γ,自动获得了聚类中心。采集航空发动机转子模拟振动信号实验数据,分别采用传统CFSFDP算法、改进后的CFSFDP算法、K均值聚类和模糊C均值聚类进行分析,结果表明,所提算法能够很好地改善聚类精度,其聚类精度相比K均值聚类和模糊C均值聚类有很大优势,且在故障特征的分类与识别上均优于其他两种算法。 相似文献
2.
针对模糊C均值(FCM)算法聚类结果对初始中心点敏感以及聚类过程中没有考虑到不同密度样本点在聚类过程中影响力不同的缺陷,提出了一种密度峰值和样本点空间邻域信息优化的FCM算法。改进后的算法选择数据集中具有局部密度峰值的样本点或者局部密度较大的样本点作为初始聚类中心,充分考虑样本点邻域之间的关系,增加局部密度值大的样本点在聚类中心迭代计算过程中的影响力,从而达到优化FCM算法聚类效果的目的。理论分析和在人造数据集、加州大学欧文分校(UCI)机器学习数据库中真实数据上的实验结果表明,改进后算法的抗噪性、聚类效果和全局收敛能力均优于传统FCM算法。 相似文献
3.
针对大多基于聚类的离群点检测算法往往需要人工输入参数,对于不同的数据集很难选择一个合适参数的问题,将无参数的基于自然邻居的离群点检测算法的自然邻居搜索算法和密度峰值聚类算法相结合,提出一种基于聚类离群因子和相互密度的离群点检测算法。该算法使用相互密度和γ密度构造决策图,将γ密度异常大的样本点作为聚类中心进行聚类,最后根据聚类的离群因子找出离群聚类边界检测离群点,该算法不需要人工输入参数。在模拟数据集和真实数据集下进行了实验,证明了所提算法能很好地进行聚类和离群数据的挖掘。 相似文献
4.
考虑到现有费舍尔判别分析(FDA)及其改进算法无法同时有效利用有标签数据和无标签数据进行学习,提出一种基于密度峰值聚类的正则化局部费舍尔判别分析(DPC-RLFDA)算法。该算法首先利用密度峰值聚类算法得到的伪标签构造两个正则化项来规范局部FDA的类间散度矩阵和类内散度矩阵;然后通过求解目标函数得到最优投影向量。此外,为适用于非线性非高斯分布数据集,提出了基于核的DPC-RLFDA。在人工数据集和UCI数据集上的实验结果表明,与FDA及其改进算法相比,所提算法的判别性能得到了显著提升。 相似文献
5.
针对云制造平台海量多样的服务资源分类界限模糊的问题,分析了云服务和制造资源之间的关系,提出云制造下混合式资源服务聚集模型。此外,文章基于k-means聚类算法建立了聚类有效性评估函数;针对k-means聚类算法对初始聚簇中心敏感易陷入局部最优的缺点,引入蛙跳算法确定初始聚簇中心,利用反向解扩大初始蛙群的搜索范围,结合最优解均值改进族群最差蛙的优化,提高族群的信息共享能力,结合改进后的蛙跳算法和k-means迭代,提出一种基于蛙跳算法改进的k-means聚类算法。最后,以两种数据集和云平台上同类机床资源为例,验证了所提聚类算法的有效性和可行性。 相似文献
6.
针对传统的窑炉异常检测方法易受主观因素干扰且存在异常冗余报错的情况,提出一种基于人工蜂群算法的密度峰值聚类(ABC-DPC)的玻璃窑炉能耗异常检测方法。该方法针对密度峰值聚类存在人工设定参数和无法自动划分簇中心和离群点的不足,以人工蜂群算法实现了截断距离的自适应优选过程,并设立离群系数策略以实现自动划分簇中心和离群点的功能。研究了玻璃窑炉的分层能耗模型,并基于此导出能耗特征值,然后应用ABC-DPC算法实现窑炉异常能耗的聚类检测。实验结果表明,所提出算法较于经典聚类算法,检测准确率较高,而且能实时地检测窑炉的能耗异常状况。 相似文献
7.
针对大数据环境下并行谱聚类算法存在的节点负载不均衡、冗余计算、矩阵相乘时间开销大以及初始簇中心敏感等问题,提出了基于KD(k-dimension)树和混沌蜉蝣优化算法的并行谱聚类算法(PSC-MO)。首先,提出基于采样的KD-tree数据分区策略(DPS)划分数据,保证了节点间负载均衡;其次,在构建稀疏相似矩阵过程中,提出优化的分区分配策略(OPA)和基于三角不等式的KD树剪枝策略以进行跨分区的t近邻搜索,避免了过多的冗余计算;然后,提出正规化定理,通过元素对应相乘的方式代替矩阵相乘以优化Laplacian矩阵正规化过程,有效地减少了时间开销;最后,提出混沌蜉蝣优化算法(CMO),得到最佳位置作为初始簇中心后进行k-means并行聚类,解决了算法对初始簇中心敏感的问题。实验表明,PSC-MO算法不但具有良好的聚类效果,而且在大规模数据集上表现出了良好的数据和系统可扩展性。 相似文献
8.
9.
针对常用聚类算法对复杂分布数据难以有效聚类的问题,把网络分析技术与基于代价函数最优的聚类技术相结合,提出一种新颖的迭代可调节网络聚类算法。该算法采用网络的思想建立样本空间模型,把数据聚类问题转化为基于节点生长连接的网络分析问题;并设计了可调节的节点间相似关系测度和相应的聚类准则来构建节点间邻域搜索及节点生长操作;通过改变调节系数来实现网络节点间连接关系的整体调节。新算法能够在无需预先设定簇数目的情况下,自动获得簇的数目和样本数据的分布位置。采用4组不同样本分布的人工数据集聚类和往复压缩机气阀泄漏故障诊断试验,对比测试了新算法与K均值算法(KM)的性能,结果表明迭代可调节网络聚类算法可实现对复杂分布的流形数据聚类,在准确率及自动处理程度性能指标上明显优于常用的KM算法。 相似文献
10.
遗传算法具有快速良好的全局搜索能力,而蚁群聚类算法具有良好的分布式并行性和正反馈能力.K-Means、基于密度的聚类是常见的基于分割的聚类方法,它在处理空间数据时具有快速、有效处理噪声点和发现任意形状的聚类等优点.聚类算法概述聚类分析是数据挖掘领域中的一项重要的研究课题,本文主要研究是将遗传算法,蚂蚁算法、K-Means算法、密度思想结合在一起,提出了一种基于密度蚂蚁思想的K-Means算法,采用密度函数法的多中心聚类并结合小类合并运算的聚类结果明显优于K-means的聚类结果,提高了聚类的质量.再结合密度思想,使蚂蚁有选择地遍历,提高了算法效率,并克服了基于密度的算法不能发现任意形状聚类的问题. 相似文献
11.
多均值聚类算法假设每个类拥有多个子类,通过求解优化问题的方式来求解每个样本子类的划分和最终类簇的划分.该算法弥补了K-均值算法在非球数据集上的劣势,取得了较好的聚类效果,但是该算法无法被运用到多视图数据集上.本文提出了一种多视图K-多均值聚类算法,保留了K-多均值设置多个子类的设计,引入了视图权重参数,将目标聚类数作为限制条件,通过求解最优问题获得最终的类簇.将本文提出的算法与流行的多视图聚类算法进行对比实验,证明了本文算法的优越性. 相似文献
12.
为获取散乱点集的拓扑邻域数据,提出一种基于均值逆向漂移的自适应迭代搜索查询算法,基于R*树动态空间索引,采用动态扩展空心球k邻域查询算法快速获取目标样点的拓扑邻域参考数据,根据邻域查询与点集密度分布的关系,采用核密度估计描述点集的分布规律,利用均值漂移算法计算得到能够反映散乱点集局部分布特征的均值漂移矢量和均值点,将邻域搜索区域沿逆向均值漂移矢量移动进行邻域查询并实时更新样点的拓扑邻域参考数据,进而完成拓扑邻域查询的均值逆向漂移迭代计算,最终实现样点拓扑邻域数据的自适应搜索查询。试验表明,该算法可快速获取复杂型面均匀或非均匀采样点集的邻域数据,查询结果包含Voronoi邻域及其他有效邻域参考数据,能更好地反映散乱点集局部型面特征。 相似文献
13.
《计算机集成制造系统》2017,(8)
针对设计理性的自动聚类问题,提出一种基于密度峰值法的设计理性聚类方法。该方法结合设计理性的语义特点,利用单元本词汇频率/单元本频率值方法将设计理性转化为特征向量。然后基于密度峰值法求出每个特征向量的局部密度和距离两个参数,绘制决策图确定聚类中心,并将其余的数据指派到相应所属的类别中。针对密度峰值法在处理密度分布不均的数据时聚类效果差的问题,利用K最近邻方法定义动态截断距离来改进局部密度函数。以某机械设计团队的55个设计理性为例验证了所提方法的有效性。 相似文献
14.
15.
为提高故障辨识准确率,提出一种专用于故障数据集自适应确定聚类类别数目的非参数加权特征提取(NWFE)和模糊核C-均值(KFCM)相结合的算法。以一个双跨度转子实验台作为实验研究对象,在将核函数与模糊C-均值方法相结合的基础上,采用NWFE算法中加权聚类中心的计算实现了为每个样本分配不同的权值,并引入聚类评价指标PBMF自适应地确定出最佳聚类数目。用Iris经典数据集对算法进行验证表明,所提算法能够克服传统算法中存在的同等对待不同样本特征和完全靠先验知识确定聚类数目的弊端。将该算法应用到转子实验台模拟故障的特征数据集中,进一步表明了其在转子故障数据集聚类分析中的有效性和实用性。 相似文献
16.
17.
针对实际应用中三维模型数据集的模型分类管理、检索聚类预处理等聚类问题,提出了一种基于划分方法的无监督聚类模型。该模型通过以傅里叶矩不变算法为基础的特征提取算法,综合运用了现有聚类算法,将特征提取和聚类计算有效结合起来,充分考虑了聚类模型数据格式的敏感性问题。计算结果表明,该方法对有一定类结构的数据集在有整体聚类效果的情况下有一定的局部最优性。 相似文献
18.
为快速、精确地从云制造平台资源池中搜索到满足用户需求的资源,实现资源与需求的高效匹配,提出了一种资源需求高效匹配策略。首先,建立了资源与需求的形式化描述模型,在此基础上,采用改进的K-means聚类算法按基本信息进行聚类,对云服务池中的资源进行预处理,形成多个资源簇;其次,计算用户需求与各资源簇聚类中心基本信息的相似度,确立备选资源簇;最后,再分别从资源的状态信息、功能信息和服务信息3个方面对备选资源簇中的备选资源进行筛选匹配。实例分析和研究结果表明:与已有的匹配方法相比,该方法在保持较高匹配精度的同时具有更高的匹配效率。 相似文献
19.
20.
基于聚类和距离的大数据集离群点检测算法 总被引:1,自引:0,他引:1
针对已有的基于距离的离群点检测算法在大数据集上扩展性差的问题,提出了基于聚类和距离混合的大数据集离群检测算法.算法第一阶段采用层次聚类和k-means混合的层次k-means算法对数据进行聚类,并按照一个启发式规则对其进行排序.第二阶段在聚类的结果上采用嵌套循环算法进行离群检测,并通过两个剪枝规则进行高效舅枝,减少了离群检测时数据点之间距离计算的次数.理论分析和实验结果证明了算法的可行性和效率. 相似文献