首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 492 毫秒
1.
一种改进的k-means初始聚类中心选取算法   总被引:3,自引:0,他引:3       下载免费PDF全文
在传统的k-means聚类算法中,聚类结果会随着初始聚类中心点的不同而波动,针对这个缺点,提出一种优化初始聚类中心的算法。该算法通过计算每个数据对象的密度参数,然后选取k个处于高密度分布的点作为初始聚类中心。实验表明,在聚类类别数给定的情况下,通过用标准的UCI数据库进行实验比较,发现采用改进后方法选取的初始类中心的k-means算法比随机选取初始聚类中心算法有相对较高的准确率和稳定性。  相似文献   

2.
对粗糙集、Vague集及粗糙Vague集的概念、知识表示方法进行了讨论,描述了粗糙Vague集的相关概念,在研究了粗糙Vague集相似性度量方法的基础上,提出了一种对踌躇度пvxk步细化的k步相似度量新方法,并且研究了该方法的相关性质。进一步对k步相似度量在k趋向无穷时求极限,得出粗糙Vague集退化为模糊集的特例情况。  相似文献   

3.
针对数据挖掘中文本自动分类问题,提出了一种基于k-means聚类算法和支持向量机相结合的文本分类方法。该方法先将文本大致聚为k类,然后对每一类用支持向量机进行细分。构造了可用于多个模式类识别的多层SVM模型,该模型可完成对多个模式的分类识别。给出了该模型的构造及应用的方法,并验证了该方法的有效性。  相似文献   

4.
客户行为的有效聚类   总被引:1,自引:0,他引:1       下载免费PDF全文
对客户的交易数据进行聚类是客户行为分析的一个重要手段。针对客户交易数据维数高的特点,提出了基于EMD和K-means的顾客行为聚类算法。首先利用EMD和自底向上分段算法实现交易数据序列维度的约简,再利用K-means算法完成降维后序列的聚类,最后利用每个类别中购买率较高的商品作为该类的描述,为商家提供促销依据。该聚类算法一方面可以有效实现客户行为的聚类,另一方面,由于算法对交易数据序列进行了降维处理,节约了一定的存储空间。  相似文献   

5.
提出了基于蕴涵算子族L-λ-R0的模糊推理的思想,这将有助于提高推理结果的可靠性。针对蕴涵算子族L-λ-R0给出了模糊推理的FMP模型的三I支持算法、α-三I支持算法。  相似文献   

6.
研究了一类包含网络诱导时滞、数据丢包以及错序等非理想网络模型的H控制问题。针对以往H控制器设计算法的缺点,通过建立新的差分不等式,提出了一个新的改进算法。新算法具有保守性弱、不需事先给定H范数上界以及不需要计算逆矩阵等特点。数值仿真例子表明,新算法是有效的。  相似文献   

7.
一种新的聚类有效性函数   总被引:3,自引:1,他引:2       下载免费PDF全文
聚类有效性函数是用于评价聚类结果优劣的指标,准确地给出初始聚类类别数将使得聚类结果趋于合理化。根据模糊不确定性理论及聚类问题的基本特性,引入了新的紧密度度量指标DiU;c),在此基础上提出了一个旨在寻求最优聚类类别数的有效性函数。该函数基于数据集的紧密度与分离度特征,综合考虑了数据成员的隶属度及数据集的几何结构。实验结果表明该有效性函数能够发现最优的聚类类别数,对于分类结构较为明确的数据集表现出良好的性能,并且对于权重系数具有良好的鲁棒性。  相似文献   

8.
以K-means为代表的聚类算法被广泛地应用在许多领域, 但是K-means不能直接处理不完整数据集. km-means是一种处理不完整数据集的聚类算法, 通过调整局部距离计算方式, 减少不完整数据对聚类过程的影响. 然而km-means初始化阶段选取的聚类中心存在较大的不可靠性, 容易陷入局部最优解. 针对此问题, 本文引入可信度, 提出了结合可信度的km-means聚类算法, 通过可信度调整距离计算, 增大初始化过程中选取聚类中心的可靠性, 提高聚类算法的准确度. 最后, 通过UCI和UCR数据集验证算法的有效性.  相似文献   

9.
单向Sp-粗集中,具有属性集α的知识[x](R-元素等价类[x])具有这样的特征:若α内被补充属性,则[x]内的元素个数被减少。利用这一特征,考虑属性补充的随机性,给出Sp-上阶梯知识,Sp-上阶梯知识的依信度生成,Sp-上阶梯知识属性依赖的原理,给出Sp-上阶梯知识的属性依赖挖掘定理,Sp-上阶梯知识的状态识别算法。  相似文献   

10.
研究了基于正则蕴涵算子G-λ-R0模糊推理的三I算法的约束度理论,分析了约束度的性质,给出了α-三I算法的FMP(FMT)上(下)确界的计算公式。  相似文献   

11.
改进的基于遗传算法的粗糙聚类方法   总被引:2,自引:0,他引:2       下载免费PDF全文
传统的聚类算法都是使用硬计算来对数据对象进行划分,然而现实中不同类之间对象通常没有明确的界限。粗糙集理论提供了一种处理边界对象不确定的方法。因此将粗糙理论与k-均值方法相结合。同时,传统的k-均值聚类方法必须事先给定聚类数k,但实际情况下k很难确定;另外虽然传统k-均值算法局部搜索能力强,但容易陷入局部最优。遗传算法能得到全局最优解,但收敛过快。鉴于此,提出了一种改进的基于遗传算法的的粗糙聚类方法。该算法能动态地生成k-均值聚类数,采用最大最小原则生成初始聚类中心,同时结合粗糙集理论的上近似和下近似处理边界对象。最后,用UCI的Iris数据集分别对算法进行实际验证。实验结果表明,该算法具有较高的正确率,综合性能更加稳定。  相似文献   

12.
王莉  周献中  沈捷 《控制与决策》2012,27(11):1711-1714
Lingras提出的粗K均值聚类算法易受随机初始聚类中心和离群点的影响,可能出现一致性和无法收敛的聚类结果.对此,提出一种改进的粗K均值算法,选择潜能最大的K个对象作为初始的聚类中心,根据数据对象与聚类中心的相对距离来确定其上下近似归属,使边界区域的划分更合理.定义了广义分类正确率,该指标同时考虑了下近似集和边界区域中的对象,评价算法性能更准确.仿真实验结果表明,该算法分类正确率高,收敛速度快,能够克服离群点的不利影响.  相似文献   

13.
针对现有的基于流形距离的聚类算法对“绝对流形”数据集较“相对流形”数据集聚类效果佳和参数[ρ]在较大范围内变化时,聚类性能较差等问题,提出基于改进流形距离的粗糙集k-means聚类算法。该算法通过用属性划分和最大最小距离选择初始聚类中心,以改进的流形距离和粗糙集优化k-means,并结合终止判断条件以达到解决边界数据聚类问题和提升聚类效果的目的。仿真结果表明:该算法对“绝对流形”和“相对流形”数据集聚类效果均有较好改善,且参数变化对聚类性能影响较大。  相似文献   

14.
改进的快速虹膜定位算法   总被引:3,自引:1,他引:2       下载免费PDF全文
针对虹膜的灰度分布特点,提出了一种粗定位和精定位相结合的虹膜定位算法。首先,通过k-mans聚类算法对图像进行动态阈值分割,分离出瞳孔区域,利用圆的几何特性进行粗定位;然后运用Gauss滤波降低噪声干扰和Canny算子进行边缘检测,结合粗定位的结果,应用Hough变换进行精定位,以快速提取虹膜内外边缘。实验表明,该方法能准确快速地定位虹膜的边界以满足实时性要求。  相似文献   

15.
传统聚类方法将对象严格地划分到某一类,但很多时候边界对象不能被严格地划分.粗糙集用上近似集和下近似集表示一个类,对这种边界不确定的处理非常有效,典型算法有基于粗糙集的k-means聚类算法和基于粗糙集的leader聚类算法.本文针对RFA(R0ughFuzzyApproach)算法存在的不足,提出了一种新的基于粗糙集的leader聚类算法(NRL,Novel Rough-based Leader).其基本思想是首先数据项由于与其最近类中心的距离不同,分别被划分到leader集或者supporting leader集,然后对leader集和supporting leader集进行标号,得到聚类结果.实验结果表明NRL算法非常有效.  相似文献   

16.
基于分类的半监督聚类方法   总被引:1,自引:0,他引:1       下载免费PDF全文
提出一种基于分类的半监督聚类算法。充分利用了数据集中的少量标记对象对原始数据集进行粗分类,在传统k均值算法的基础上扩展了聚类中心点的选择方法;用k-meansGuider方法对数据集进行粗聚类,在此基础上对粗聚类结果进行集成。在多个UCI标准数据集上进行实验,结果表明提出的算法能有效改善聚类质量。  相似文献   

17.
基于粗糙集的混合属性数据聚类算法   总被引:2,自引:0,他引:2  
范黎林  王娟 《计算机应用》2010,30(12):3377-3379
传统聚类方法将对象严格地划分到某一类,但是很多时候边界对象不能被严格地划分。基于粗糙集的k-means聚类算法和基于粗糙集的leader聚类算法,利用粗糙集理论将数据对象划分到一个簇的上近似集或下近似集当中,提供了一种新的处理不确定性的视角,很好地解决了这种边界不确定问题。但其缺点是不能处理混合属性数据,聚类结果对初值有明显的依赖性。针对这些算法存在的不足,给出了一种适用于混合属性数据的距离定义,对初始值的选取提出了改进办法,提出了一种基于粗糙集的混合属性数据聚类算法。仿真实验证明,在不确定聚类簇数的情况下,该算法的聚类准确率比传统k-means算法明显提高。  相似文献   

18.
Fuzzy sets, rough sets are efficient tools to handle uncertainty and vagueness in the medical images and are widely used for medical image segmentation. Soft sets are a new mathematical approach to uncertainty and vagueness. In this paper, a hybrid segmentation algorithm based on soft sets namely soft fuzzy rough c-means is proposed to extract the white matter, gray matter and the cerebro spinal fluid from MR brain image with bias field correction. In this algorithm, soft fuzzy rough approximations are applied to obtain the rough regions of image. These approximations are free from defining thresholds, weight parameters and are less complex compared to the existing rough set based algorithms. Soft sets use similarity coefficients to find the similarity of the clusters formed in present and previous step. The proposed algorithm does not involve any negative region, hence all the pixels participate in clustering avoiding clustering mistakes. Also, the histogram based centroids choose the centroids close to the ground truth that in turn effect the definition of approximations, standardizing the clusters. The proposed algorithm evaluated through simulation, compared it with existing k-means, rough k-means, fuzzy c-means and other hybrid algorithms. The soft fuzzy rough c-means algorithm outperforms the considered algorithms in all analyzed scenarios even in extracting the tumor from the brain tissue.  相似文献   

19.
Rough k-means clustering describes uncertainty by assigning some objects to more than one cluster. Rough cluster quality index based on decision theory is applicable to the evaluation of rough clustering. In this paper we analyze rough k-means clustering with respect to the selection of the threshold, the value of risk for assigning an object and uncertainty of objects. According to the analysis, clusters presented as interval sets with lower and upper approximations in rough k-means clustering are not adequate to describe clusters. This paper proposes an interval set clustering based on decision theory. Lower and upper approximations in the proposed algorithm are hierarchical and constructed as outer-level approximations and inner-level ones. Uncertainty of objects in out-level upper approximation is described by the assignment of objects among different clusters. Accordingly, ambiguity of objects in inner-level upper approximation is represented by local uniform factors of objects. In addition, interval set clustering can be improved to obtain a satisfactory clustering result with the optimal number of clusters, as well as optimal values of parameters, by taking advantage of the usefulness of rough cluster quality index in the evaluation of clustering. The experimental results on synthetic and standard data demonstrate how to construct clusters with satisfactory lower and upper approximations in the proposed algorithm. The experiments with a promotional campaign for the retail data illustrates the usefulness of interval set clustering for improving rough k-means clustering results.  相似文献   

20.
粗糙集连续属性离散化模型研究与应用要点分析   总被引:10,自引:0,他引:10  
基于粗糙集理论,研究连续属性离散化问题的本质特点,提出粗糙集指标衡量和优化算法结构相统一的离散化思想,设计通用的离散化方法模型。分析主流的SOM网络、GA、层次聚类、信息熵等主流聚类方法的特点,并基于这种结构模型,给出了相应离散化方法的应用要点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号