共查询到10条相似文献,搜索用时 218 毫秒
1.
为解决传统谱聚类算法在应用于大规模数据上时,复杂度较高且资源占用较大,导致算法聚类效果不好甚至无法聚类的问题,提出基于并行框架和采样相结合的改进谱聚类算法,算法在自适应相似矩阵计算基础上,通过数据分块和单向节点并行,提高算法相似矩阵的计算效率,通过Nystr(o)m加权抽样逼近,减少拉普拉斯矩阵特征向量的计算复杂度,最后通过KD树结构避免k-mean聚类过程的距离计算,从而提高了聚类效率.仿真实验结果表明,文中算法在取得与传统算法相近的聚类性能的同时,取得更好的加速比,验证了算法对大规模集的良好适应性. 相似文献
2.
经典谱聚类算法将数据聚类转为图划分问题,在分析其Normalized Cut函数与传统加权核k-means等价基础上,设计了一种基于抽样改进加权核k-means算法的大规模数据集谱聚类算法,算法通过加权核k-means迭代优化避免Laplacian矩阵特征分解的大量资源占用,通过随机映射得到近似奇异值分解,并由近似奇异向量确定各点数据权重及抽样概率,以此得到快速合理抽样,通过数据抽样并将聚类中心约束到抽样点生成的子空间中,避免全部核矩阵的使用,从而降低经典算法的时间空间复杂度。实验结果表明,改进算法在保持与经典算法相近精度基础上,大幅提高了聚类效率,实验验证了改进算法的有效性。 相似文献
3.
4.
针对传统模糊C-均值(FCM)聚类算法计算量大,聚类中心对初始值敏感和聚类数目不能自适应确定的缺点,提出了一种改进的FCM算法。首先对图像进行采样量化,并在满足视觉一致性的L*a*b*颜色空间计算并统计图像的色差信息,然后依据全局色差阈值选取初始聚类中心,对图像进行聚类分析,同时根据准则函数确定最佳聚类数,实现了聚类中心的优化选取和最优聚类数目的确定,有效减少了计算量。研究结果表明,改进后的FCM算法不仅较好地克服了传统FCM算法的缺点,而且聚类效果好,处理速度快,聚类效果与人的视觉感应保持了良好的一致性。 相似文献
5.
在数控机床热误差建模中,温度测点的选择与优化是一个难点。针对传统的FCM模糊聚类方法对数控机床温度测点优化需要人为事先确定聚类数目,提出了一种FCM自适应模糊聚类测点优化方法。该方法在FCM聚类算法的基础上,建立了聚类数自适应函数,并自动给出最佳聚类数。通过对一台立式铣床进行实验验证,结果表明:FCM自适应模糊聚类方法自动将机床的温度测点由13个减少到6个。结合多元回归分析,建立了关键测温点的热误差模型,所建立的热误差模型精度较高,热误差由50μm减小到10μm以下,验证了该方法的有效性。 相似文献
6.
7.
针对模糊C均值(FCM)算法聚类结果对初始中心点敏感以及聚类过程中没有考虑到不同密度样本点在聚类过程中影响力不同的缺陷,提出了一种密度峰值和样本点空间邻域信息优化的FCM算法。改进后的算法选择数据集中具有局部密度峰值的样本点或者局部密度较大的样本点作为初始聚类中心,充分考虑样本点邻域之间的关系,增加局部密度值大的样本点在聚类中心迭代计算过程中的影响力,从而达到优化FCM算法聚类效果的目的。理论分析和在人造数据集、加州大学欧文分校(UCI)机器学习数据库中真实数据上的实验结果表明,改进后算法的抗噪性、聚类效果和全局收敛能力均优于传统FCM算法。 相似文献
8.
9.
高光谱图像分类是高光谱数据分析的重要研究内容之一。模糊C-均值聚类算法因其算法简单、收敛速度快等优点受到广泛的关注。由于高光谱数据的维数较高,其光谱波段的非线性特性使得传统模糊C-均值聚类算法无法在原始空间得到较好的聚类结果。另外,模糊C-均值聚类算法在计算聚类中心时,仅使用了各样本对聚类中心的隶属度,忽略了样本之间固有存在的空间分布特征。为此提出了模糊核加权C-均值聚类算法,在计算模糊核聚类中心时,根据样本的空间分布特征,为每个样本分配不同的权值,使得每个核聚类中心随着样本的不同而各有不同。标准数据和实际高光谱数据的实验结果均表明,相比较传统模糊C-均值均聚类算法,模糊核加权C-均值聚类算法在总体分类精度上有较大的提高。 相似文献
10.
为提高故障辨识准确率,提出一种专用于故障数据集自适应确定聚类类别数目的非参数加权特征提取(NWFE)和模糊核C-均值(KFCM)相结合的算法。以一个双跨度转子实验台作为实验研究对象,在将核函数与模糊C-均值方法相结合的基础上,采用NWFE算法中加权聚类中心的计算实现了为每个样本分配不同的权值,并引入聚类评价指标PBMF自适应地确定出最佳聚类数目。用Iris经典数据集对算法进行验证表明,所提算法能够克服传统算法中存在的同等对待不同样本特征和完全靠先验知识确定聚类数目的弊端。将该算法应用到转子实验台模拟故障的特征数据集中,进一步表明了其在转子故障数据集聚类分析中的有效性和实用性。 相似文献