首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
陈皓  潘晓英  崔杜武 《计算机应用》2011,31(4):1090-1093
为提高族群进化算法对约束函数的优化性能,应用基于线性截取策略的大配子采样机制来提高群体进化过程中大配子筛选的稳定性。该机制可有效减少在进化过程中族群结构的大幅波动,提高族群进化算法的搜索效率。通过对六个典型约束函数的仿真实验显示,该机制使族群进化算法成为了一种有竞争力的约束函数优化算法。  相似文献   

2.
针对传统的聚类算法需要知道类的真实数目,以及容易陷入局部最优的缺陷,提出基于群进化策略的模糊聚类算法,简称fuzzyGAC。该算法将群进化策略与模糊聚类结合起来,通过两个阶段(继承阶段和重新分配阶段)来产生新的聚类结果。将提出的算法与模糊C均值算法、差分算法、粒子群算法进行比较,实验结果表明,就类的数目和聚类中心而言,该算法可以自适应地修正类的数目并且提供最优的聚类中心。  相似文献   

3.
移动对象轨迹数据管理是移动计算领域的研究热点。通过采样技术构造数据流摘要是普通采用的方法之一。传统的均匀采样往往容易丢失某些关键变化数据。利用轨迹数据流的局部连续性特征,提出一种基于滑动窗口的偏倚采样算法。算法将滑动窗口通过聚类划分成若干大小不一的基本窗口,并针对每个基本窗口给定一个采样率,对窗口内数据进行偏倚采样,从而形成数据流摘要。算法利用了轨迹数据的内在特征,因此具有较高的采样质量。最后,基于实际数据对算法进行了实验,结果证明了算法的有效性。  相似文献   

4.
主动学习是一种机器学习方法,需要选择最有价值的样本进行标注。目前,主动学习在应用时面临着一些挑战,其依赖分类器的先验假设,这容易导致分类器性能意外下降,同时需要一定规模的样本作为启动条件。聚类可以降低问题规模,是主动学习的一种有效手段。为此,结合密度聚类边界采样,开展主动学习方法的研究。针对容易产生分类错误的聚类边界区域,通过计算样本密度,提出一种密度峰值聚类边界点采样方法;在此基础上,给出密度熵的定义,并利用密度熵对聚类边界区域进行启发式搜索,提出一种基于聚类边界采样的主动学习方法。试验结果表明,与文献中的5种主动学习算法相比,该算法能够以更少标记量获得同等甚至更高的分类性能,是一种有效的主动学习算法;在标记不足,无标签样本总量20%的情况下,算法在Accuracy、F-score等指标上取得较好的结果。  相似文献   

5.
王圆方 《软件》2020,(2):201-204
针对SMOTE算法在合成少数类新样本时存在的不足,提出了一种基于层次聚类算法改进的SMOTE过采样法H-SMOTE。该算法首先对少数类样本进行层次聚类,其次根据提出的簇密度分布函数,计算各个簇的簇密度,最后在各个簇中利用改进的SMOTE算法进行过采样,提高合成样本的多样性,得到新的平衡数据集。通过对UCI数据集的实验表明,H-SMOTE算法的分类效果得到明显的提升。  相似文献   

6.
数据流随时间演变具有突发性及随机性的特点,如何自适应、实时追踪这种变化是数据流挖掘面临的一个重要问题,完全由用户通过试探来甄别这种变化在实际中无法实现,同时也失去了数据流聚类进化追踪的现实意义。针对聚类变化自动追踪问题,考虑到现实的计算资源限制和处理速度要求,结合分形聚类、自适应采样技术与Chernoff不等式,提出了数据流聚类演变实时追踪算法,进行聚类演变的自动追踪;通过合成与实际数据集上的实验工作验证了算法的有效性。  相似文献   

7.
针对当前关联性数据在聚类后聚类结果与对应聚类簇之间距离过大,聚类簇本身聚类纯度较低等影响聚类质量的问题,开展相关研究。通过构建关联性大数据实时流式可控聚类框架、可控粗聚类、可控细聚类,提出一种全新的聚类算法。实验结果表明,新的聚类算法聚类结果与对应聚类簇的距离平方和数值更小,聚类簇本身聚类纯度更高,进一步提升聚类结果的质量,实现对关联性大数据的高效利用。  相似文献   

8.
大数据聚类算法综述   总被引:1,自引:0,他引:1  
海沫 《计算机科学》2016,43(Z6):380-383
随着数据量的迅速增加,如何对大规模数据进行有效的聚类成为挑战性的研究课题。面向大数据的聚类算法对传统金融行业的股票投资分析、互联网金融行业中的客户细分等金融应用领域具有重要价值。对已有的大数据聚类算法进行了详细划分,并比较了每种聚类算法的优缺点,进一步总结了已有研究存在的问题,最后对未来的研究方向进行了展望。  相似文献   

9.
一种新型的基于密度和栅格的聚类算法*   总被引:2,自引:1,他引:1  
针对网格和密度方法的聚类算法存在效率和质量问题,给出了密度和栅格相结合的聚类挖掘算法,即基于密度和栅格的聚类算法DGCA(density and grid based clustering algorithm)。该算法首先将数据空间划分为栅格单元,然后把数据存储到栅格单元中,利用DBSCAN密度聚类算法进行聚类挖掘;最后进行聚类合并和噪声点消除,并将局部聚类结果映射到全局聚类结果。实验通过人工数据样本集对该聚类算法进行理论上验证,表明了该算法在时间效率和聚类质量两方面都得到了提高。  相似文献   

10.
为克服不平衡数据集中存在的噪声、小分离、类内和类间不平衡问题,提出一种基于HDBSCAN (hierarchical density-based spatial clustering of applications with noise)聚类的自适应过采样技术。该技术只对HDBSCAN发现的任意形状的集群进行过采样,在稀疏度大的集群中自适应地合成较多的样本,在稀疏度小的集群中合成相对较少的样本,且合成的样本靠近集群中心。实验结果表明,该方法可有效避免不平衡数据集中噪声的产生,同时克服类间和类内不平衡问题,为不平衡学习提供了一种过采样策略。  相似文献   

11.
族群是依据个体编码特征的相似性对群体进行分类后形成的一种群体结构化组织,基于该机制形成了一种新的进化模型—族群进化算法(ethnic group evolution algorithm,EGEA)。族群机制可有效调控群体结构,协调算法的全局搜索和局部搜索时间,同时利用其所具有的分类能力也可方便地获取群体中的典型个体。设计了族群的经验学习机制来挖掘蕴含于群体中的进化经验知识,并利用这些知识来引导群体的搜索,提高EGEA的收敛速度。仿真实验表明族群的经验学习机制不仅是可行的而且是有效的,它显著提高了EGEA的搜索效率。  相似文献   

12.
陈皓  崔杜武 《计算机应用》2009,29(1):105-108
族群进化算法(EGEA)利用族群机制进行群体结构调控。在基于二进制编码的群体中,个体间编码的差异性被作为族群聚类的标准。由于自然二进制编码所存在的Hamming悬崖问题易影响族群聚类的准确性,从而降低EGEA的搜索效率,因此提出利用Gray编码连续个体间编码只有一位不同的特点来改进族群聚类的精度。针对典型多维函数的仿真实验表明,基于Gray编码的族群聚类过程可显著提高EGEA的收敛速度和解的精度。  相似文献   

13.
经济负荷分配(Economic Load Dispatch,ELD)是电力系统中一种重要的优化问题,它可归为一类高维、离散、非线性的多约束函数优化问题。针对这类问题,提出了一种基于线性截取策略的改进族群进化算法——EGEA/LT,并使用EGEA/LT对IEEE的3机、6机和15机3个仿真系统进行了优化实验,将实验结果与其他典型算法优化结果进行比较,说明了EGEA/LT是一种求解ELD问题的有效方法。  相似文献   

14.
延长网络生存期、减少网络能量消耗是传感器网络一项重要性能指标,分簇方案是实现该目标的主要方法之一.引入了传感器节点检测半径的概念,在分簇算法的基础上提出一种能量优化策略,该策略通过减少网络中处于激活状态节点的个数,减少网络消耗能量,延长网络的生存期.最后通过对典型的分簇算法LEACH应用该优化策略,仿真结果表明能量优化策略能显著的减少网络的能量消耗.  相似文献   

15.
提出一种选择最富信息数据并予以标记的基于主动学习策略的半监督聚类算法。首先, 采用传统K-均值聚类算法对数据集进行粗聚类; 其次, 根据粗聚类结果计算出每个数据隶属于每个类簇的隶属度, 筛选出满足最大与次大隶属度差值小于阈值的候选数据, 并从中选择差值较小的数据作为最富信息的数据进行标记; 最后, 将候选数据集合中未标记数据分组到与每类已被标记数据平均距离最小的类簇中。实验表明, 提出的主动学习策略能够很好地学习到最富信息数据, 基于该学习策略的半监督聚类算法在测试不同数据集时均获得了较高的准确率。  相似文献   

16.
由于缺少数据分布、参数和数据类别标记的先验信息,部分基聚类的正确性无法保证,进而影响聚类融合的性能;而且不同基聚类决策对于聚类融合的贡献程度不同,同等对待基聚类决策,将影响聚类融合结果的提升。为解决此问题,提出了基于随机取样的选择性K-means聚类融合算法(RS-KMCE)。该算法中的随机取样策略可以避免基聚类决策选取陷入局部极小,而且依据多样性和正确性定义的综合评价值,有利于算法快速收敛到较优的基聚类子集,提升融合性能。通过2个仿真数据库和4个UCI数据库的实验结果显示:RS-KMCE的聚类性能优于K-means算法、K-means融合算法(KMCE)以及基于Bagging的选择性K-means聚类融合(BA-KMCE)。  相似文献   

17.
一种基于类别融合的模糊最小最大聚类算法   总被引:1,自引:1,他引:1  
提出了一种新型的基于类别融合的模糊最小最大聚类算法,该算法首先使用初始类别生成子算法对归一化后的数据集进行预处理,从而生成一系列初始模式类别;然后利用类别融合于算法,将类别融合问题转化为求一无向图的连通子图问题,从而得出在同一连通子图中的点融合为同一类,连接子图的数目为最终的聚类数目。仿真结果表明,在处理未知模式类别数目且数据样本任意分布的数据集时,该算法明显优于传统的模糊C均值算法。  相似文献   

18.
张洁  杨春玉  鞠非  徐小龙 《计算机应用》2017,37(10):2978-2982
针对大量电动汽车无序充电造成的充电站利用率不均衡问题,提出一种大规模电动汽车有序充电调度策略。首先,以电动汽车充电需求的位置为聚类指标,借助归一化相似度进行层次聚类和基于K-means算法的二次划分,以实现属性相似的电动汽车的汇聚。进一步地,通过Dijkstra算法获取电动汽车到达各个充电站的最优路径,以充电站内电动汽车的均匀分配和电动汽车充电路程最短作为目标函数,构建了基于电动汽车聚类的充电调度模型,通过遗传算法求取最优解。与未进行电动汽车聚类的充电调度策略进行的仿真对比实验结果表明,在车辆较多时所提方法的计算时间可减少一半以上,具有较高的实用性。  相似文献   

19.
首先使用混合属性数据集表示民族突发事件中的数值信息和类属信息;然后,考虑到每个属性拥有不同权重因子,改进了蚁群聚类算法中相似度密度的计算方法;在此基础上,给出了一种混合属性数据集蚁群聚类算法。聚类分析结果表明,应用该算法能得出民族突发事件的发生规律,因此该算法可用于民族突发事件的应急智能辅助决策。该算法是应急预案自动生成等工作的基础,明确给出了未来工作的内容、方法和步骤,为维护国家安全提供了智能化支持。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号