首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 112 毫秒
1.
改进K-均值聚类算法在电信客户分类中的应用   总被引:2,自引:0,他引:2  
研究电信客户分类问题,根据不同类型采用不同策略.针对电信客户实行差异化营销和服务,需对电信客户进行准确分类.传统的k-均值聚类算法是一种重要数据挖掘技方法,存在对初始值敏感和易陷入局部最优的缺陷,导致电信客户分类正确率较低.为了提高电信客户分类的正确率,提出了一种改进k-均值聚类的电信客户分类算法.首先改进k-均值聚类算法通过变异、杂交和选择操作,然后根据分类特征动态地确定初始聚类数k和自适应确定聚类中心,最后采用湖南省某地区客户分类数据进行验证性实验.仿真结果表明,改进k-均值聚类算法很好地解决全局识别寻优问题,提高了客户分类正确率,大幅度减小误差.  相似文献   

2.
在现实世界中经常遇到混合数值属性和分类属性的数据, k-prototypes是聚类该类型数据的主要算法之一。针对现有混合属性聚类算法的不足,提出一种基于分布式质心和新差异测度的改进的 k-prototypes 算法。在新算法中,首先引入分布式质心来表示簇中的分类属性的簇中心,然后结合均值和分布式质心来表示混合属性的簇中心,并提出一种新的差异测度来计算数据对象与簇中心的距离,新差异测度考虑了不同属性在聚类过程中的重要性。在三个真实数据集上的仿真实验表明,与传统的聚类算法相比,本文算法的聚类精度要优于传统的聚类算法,从而验证了本文算法的有效性。  相似文献   

3.
基于遗传算法和模糊聚类的文本分类研究   总被引:2,自引:0,他引:2  
鉴于模糊C-均值类型算法(FCM算法)对初始中心敏感的问题,提出了一种基于遗传算法和模糊聚类的文本分类方法.采用遗传算法初始聚类中心,并在适应度的计算中采用了一个可变值,用户可以在文本直接聚类时更改该值,产生用户满意的属性约简结果,极大地提高了系统的分类精度.最后通过实验给出了该算法性能的测试结果.  相似文献   

4.
分级聚类与平面划分结合方法在网页分类中的应用   总被引:2,自引:0,他引:2  
文章研究分级聚类与平面划分结合方法在网页分类中的应用。阐述了网页分类问题中样本特征分布的特点和复杂性,分级聚类能够生成层次化的嵌套类,且具有较高的准确度,但具有较高的计算复杂度,不适合计算大量样本的计算问题。K-均值算法受初始聚类中心的选择影响较大,对于不规则分布的样本往往聚类的效果不佳。文章考虑利用少数样本和分级聚类算法进行样本集合的初始聚类中心的划分,再利用K-均值算法对整个样本集合做聚类,则既可以避免分级聚类算法的计算复杂又可充分利用K-均值算法的快速特点;另一方面则利用了分级聚类算法准确度高为确定初始聚类中心提供了可靠的方法。文中给出了纯K-均值方法、分级聚类与平面划分结合方法在解决文本分类问题上的实验结果。  相似文献   

5.
由于分类型和数值型属性特性的差异,设计混合类型数据聚类算法时通常需要对两种类型属性区别对待,增加了聚类算法的设计与实现难度。另外,不同属性所包含的信息量存在差异,但现有算法通常平等对待各个属性。提出了一种融合单纯形映射与信息熵加权的混合类型数据聚类算法。基于单纯形理论将分类型属性映射为高维数值属性向量,应用信息熵理论为各属性分配权重建立相似性度量公式,将该度量方法应用于K-Means算法框架得到聚类算法。在6个UCI的混合数据集上的实验表明,提出的聚类算法优于传统映射聚类算法和K-Prototype算法,在准确度上分别提高了2.70%和18.33%。  相似文献   

6.
《微型机与应用》2016,(1):38-41
基于特征码本的图像分类方法依赖于需要特征向量与聚类中心之间的映射,然而硬加权映射方法导致了相似的特征向量被映射为不同的聚类中心,从而降低了分类的查全率。为此提出一种基于软加权映射的局部聚类向量表示方法。该方法首先用k均值算法将特征向量聚类为k个聚类中心,采用最近邻算法寻找最接近的s个聚类中心,通过特征向量与聚类中心之间的相似度和邻近程度构建软加权映射的局部聚类向量,然后统计特征直方图,最后用主成分分析减少特征直方图维度。实验结果分析表明,相比较硬加权映射方法,文中方法提高了约5%的分类准确率。  相似文献   

7.
针对FCM算法应用于基因表达数据分析时存在的局限性,提出一种特征加权自适应FCM算法。该算法在FCM算法的基础上引入数据集预处理机制,可依据数据集的分布特征自适应地获取分类数目和初始聚类中心,并通过ReliefF算法实现特征权值的自动确定。同时,新算法考虑了不同属性对分类贡献的差异,在FCM算法中引入特征权重。将算法应用于真实基因表达数据集,实验结果表明,算法能够自适应地确定聚类数目、获得稳定性较好的聚类结果,而且具有较高的聚类精度。  相似文献   

8.
现有面向矩阵数据集的算法多数通过随机选取初始类中心得到聚类结果。为克服不同初始类中心对聚类结果的影响,针对分类型矩阵数据,提出一种新的初始聚类中心选择算法。根据属性值的频率定义矩阵对象的密度和矩阵对象间的距离,扩展最大最小距离算法,从而实现初始类中心的选择。在7个真实数据集上的实验结果表明,与初始类中心选择算法CAOICACD和BAIICACD相比,该算法均具有较优的聚类效果。  相似文献   

9.
以往的免疫遗传聚类算法都要事先设置聚类数及聚类中心,采取的是有教师学习的方式,对环境的适应性不太。结合免疫网络算法和免疫遗传分类,提出了事先通过一种无教师学习,确定聚类数及聚类中心的免疫遗传分类算法,同时在聚类分类的基础上运用粗糙集对图像进行分割。通过对人脑MR图片的聚类和分割实验,验证了该方法的有效性。  相似文献   

10.
利用图像测量织物颜色的首要工作是识别出适合测色的区域,针对均值聚类算法(k-means)在聚类中心和类别数选取中存在的缺点,提出了改进的聚类算法。将RGB色泽分布中局部极大点位置作为聚类中心、以分类优度为标准确定最优分类,通过颜色聚类中心和类别数的判定,实现了不同物理形态织物图像的颜色聚类。实验表明,用改进的k-means算法处理后的颜色更均匀,更相似于理想图像,因此更适合测色。  相似文献   

11.
本文利用网络教学平台上记录的学习者行为数据,分析学生的网上学习行为,探索课程通过率与学习者行为之间的关系。使用K-means算法对学习行为数据进行聚类分析,确定每名学生的学习者类型,总结网络课程学习者行为特点,并提出优化学习建议。  相似文献   

12.
杨志彬 《信息安全与技术》2011,(11):106-107,110
随着信息技术和现代教育技术的发展,教学资源管理系统在各种不同层次的院校被广泛应用,本文基于聚类算法设计并实现一套教学资源管理系统,通过聚类算法能有效提高教学资源的检索效率从而提高教学资源管理系统的总体性能。  相似文献   

13.
以目前的高等学校教育为平台,就如何将数据挖掘技术与课堂教学质量相结合的问题进行了研究。首先介绍了模糊C均值聚类算法的原理及实现步骤,并通过对课堂教学评估指标体系的有效挖掘,选取适当的聚类参数,建立模糊划分矩阵,然后用模糊C均值聚类算法进行聚类,较好地实现了聚类目标。  相似文献   

14.
针对K-means在聚类过程中存在的随机性强、准确率不稳定等问题,提出了一种改进聚类算法,首先选取k个首尾相连且距离乘积最大的数据对象作为初始聚类中心,在簇中心迭代过程中,选取簇内距离和最小的样本作为簇中心,再将其他样本划分至相应簇中,反复迭代,直至收敛。在UCI数据集上的仿真实验结果表明:新算法与K-means算法和其他两种改进算法相比,不仅能够降低运算耗时,在准确率、Jaccard系数、F值等多项聚类指标上也有较大的提升,在实际应用中,使用新算法对现代学徒制的职业能力进行了聚类分析,解决了课程间的序化问题。  相似文献   

15.
基于协同过滤的课程推荐模型*   总被引:1,自引:0,他引:1  
通过对当前高校学生选课的盲目性的分析,提出了一种基于协同过滤的课程推荐方法。首先对课程进行聚类,构建无缺失的课程评价矩阵,在此基础上根据学生对相似课程的评分预测学生的兴趣爱好,为学生提供个性化的课程推荐。该方法在评分数据极端稀疏的情况下也可以为学生作出准确的课程推荐。最后通过实验验证了该推荐方法的实用性,可以有效地减少学生选课的盲目性。  相似文献   

16.
《数据结构》课程是计算机专业基础课,也是计算机专业的核心课程,学好《数据结构》为计算机专业的后续课程如:《操作系统》、《软件工程》、《算法设计》等课程打下基础。该文通过对民办高校学生的自身特点和《数据结构》的教学特点出发,探讨《数据结构》这门课对民办高校学生的教育教学方法,促进民办高校计算机专业学生学习这门课程的积极性和主动性,为以后学习其它课程打下坚实的基础。  相似文献   

17.
针对流密码算法RC4教学过程中存在难以理解的问题,在分析RC4算法的基础上,本文提出了一种基于摸球模型的RC4算法教学模型和教学过程,在密码学课程教学方面取得了良好的效果。  相似文献   

18.
本文探讨如何在"编译原理"教学过程中形象地演示复杂的算法过程,提出了一个演示算法步骤的方案,展示算法步骤的进行以及步骤进行时的数据联动,对于不同的动作、不同意义的数据,用图形元素和颜色加以区分,并以LR分析算法为例说明了如何分解复杂步骤,如何用图形和颜色展示移进、归约、接受、出错等分析动作以及相关数据的变化。  相似文献   

19.
方新  穆志纯  陈静  杜大鹏 《计算机应用》2005,25(12):2951-2953
以自组织特征映射算法为理论基础,提出了一种新的SOMNET算法,利用人工神经网络实现了具有相似特征的汉字的聚类以及汉字部件的聚类。并对汉字及其部件的显示效果进行了分析,从不同角度刻画了SOM模型的应用。研究结果对于汉字认知研究以及留学生第二语言习得教学具有一定的参考价值。  相似文献   

20.
针对差分隐私保护下单一聚类算法准确性和安全性不足的问题,提出了一种基于差分隐私保护的Stacking集成聚类算法。使用Stacking集成多种异质聚类算法,将K-means聚类、Birch层次聚类、谱聚类和混合高斯聚类作为初级聚类算法,结合轮廓系数对初级聚类算法产生的聚类结果加权并入原始数据,将K-means算法作为次级聚类算法对扩展后的数据集进行聚类分析。其中,针对原始数据和初级聚类算法的聚类结果分别提出自适应的ε函数确定隐私预算,为不同敏感度的数据分配不同程度的Laplace噪声。理论分析和实验结果均表明,与单一聚类算法相比,该算法满足ε-差分隐私保护的同时有效提高了聚类准确性,实现了隐私保护与数据可用性的高度平衡。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号