首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
一种基于群体智能的Web文档聚类算法   总被引:31,自引:0,他引:31  
将群体智能聚类模型运用于文档聚类,提出了一种基于群体智能的Web文档聚类算法,首先运用向量空间模型表示Web文档信息,采用常规方法如消除无用词和特征词条约简法则得到文本特征集,然后将文档的向量随机分布到一个平面上,运用基于群体智能的聚类方法进行文档聚类,最后从平面上采用递归算法收集聚类结果,为了改善算法的实用性,将原算法与k均值算法结合提出一种混合聚类算法,通过实验比较,结果表明基于群体智能的Web文档聚类算法具有较好的聚类特性,它能将与一个主题相关的Web文档较完全而准确地聚成一类。  相似文献   

2.
针对近年来学生异常行为增多问题,以一卡通为基础对校园大数据进行了挖掘与并对挖掘结果进行可视化展示。采用ARIMA时间序列预测模型对校园热点区域人流量分布进行预测,通过基于最小方差和余弦相似度的K-means改进聚类算法归纳了校园消费分布特征,对特征进行聚类,并对每类人群的特点进行了总结分析。实验结果表明,ARIMA时间序列预测模型的预测结果与真实结果的标准误差为23.46,预测结果较为理想;而改进的K-means聚类算法则通过最小方差提高初始质心的代表性,最终模型聚类结果与预期结果基本一致。通过预测和聚类结果,校园管理者可以了解学生群体特征,对学生个性特征、行为规律进行深入分析,预测学生行为,防微杜渐。  相似文献   

3.
将群体智能技术应用于半结构化的藏文Web文本聚类,提出基于群体智能的半结构化藏文Web文本聚类算法(SCAST).充分考虑群体智能技术对藏文文本聚类准确性和时间效率的影响,SCAST算法首先运用向量空间模型表示藏文文本信息,将藏文文本和智能蚁群随机放置于一个文本向量空间中.然后智能蚂蚁随机选择藏文文本,计算藏文文本在当前局部区域内的相似性,获得拾起或者放下文本的概率,进而决定是否"拾起","移动","放下"藏文文本.最后通过多次迭代训练,将藏文文本按其相似性聚集在一起,得到最终聚类结果.大量真实藏文Web文本数据上的实验结果表明,相较于传统的k-means聚类算法,基于群体智能的藏文文本聚类算法在聚类准确率上平均提高约8.0%.  相似文献   

4.
客户行为的有效聚类   总被引:1,自引:0,他引:1       下载免费PDF全文
对客户的交易数据进行聚类是客户行为分析的一个重要手段。针对客户交易数据维数高的特点,提出了基于EMD和K-means的顾客行为聚类算法。首先利用EMD和自底向上分段算法实现交易数据序列维度的约简,再利用K-means算法完成降维后序列的聚类,最后利用每个类别中购买率较高的商品作为该类的描述,为商家提供促销依据。该聚类算法一方面可以有效实现客户行为的聚类,另一方面,由于算法对交易数据序列进行了降维处理,节约了一定的存储空间。  相似文献   

5.
核DBSCAN算法在民航客户细分中的应用   总被引:1,自引:0,他引:1       下载免费PDF全文
针对民航客户行为数据的复杂性,运用数据挖掘中的DBSCAN聚类技术,结合核映射机理,提出一种基于核的DBSCAN算法,用于实现民航客户的细分。实验结果表明,该方法能突出客户之间的行为特征差异,降低聚类结果的混乱性,且其聚类纯度比原DBSCAN算法约提升30%。  相似文献   

6.
详细分析了non-metric距离对传统聚类算法的影响,提出了用有向图和有向树描述的聚类模型.基于该模型,给出了能对具有non-metric距离特征的数据进行有效聚类的算法.在实际的购物篮数据集上进行了验证;实验结果表明,所提算法在保证聚类效率的同时,大幅度提高了聚类质量.  相似文献   

7.
分析了电信行业客户关系管理系统的数据独有特点,提出基于客户细分的客户流失预测模型.首先,采用模糊核C-均值聚类算法用于客户细分并对细分结果进行分析,发现高价值客户的群体特征.再利用企业历史数据建立基于SAS数据挖掘技术的客户流失预测模型.最后,把高价值客户作为预测目标数据应用于该模型当中预测出有流失倾向的客户.实验结果表明,该方法有效可行,可以为企业提供准确、有流失倾向的客户名单.  相似文献   

8.
针对传统密度聚类算法因使用全局变量导致对不平衡数据集的适应能力较差的问题,提出了一种基于最小生成树的密度聚类算法.首先进行数据集密度峰值计算,用于估计全局密度;然后通过密度聚类将数据集划分为高密度区域和低密度区域;接着构建和分割最小生成树对低密度区域内样本进行关联挖掘,用于将高密度区域与低密度区域互联;最后计算簇密度并以此作为特征进行簇合并,得到聚类结果.该算法结合图论知识,将数据按密度特征进行分块后合并处理,克服了传统密度聚类算法存在的局限性.通过选取多个不平衡人工数据集和UCI数据集对该算法进行测试,验证了该算法的有效性与鲁棒性.  相似文献   

9.
数据聚类在智能信息处理中具有非常重要的作用。传统的数据聚类方法,如K-means算法,存在对初始聚类中心敏感等问题。随着智能优化算法的发展,人们用智能优化算法进行数据聚类取得了一定的效果,但存在容易陷入局部最优等问题。为此,本文将在高维优化问题中取得良好效果的竞争型群体优化算法中引入数据聚类,利用竞争型群体优化算法强大的全局探索能力搜索聚类中心进行数据聚类,在UCI的5个数据集上的实验结果表明竞争型群体优化算法比遗传算法、粒子群算法不仅能得到更好的聚类效果,而且收敛性能更好。  相似文献   

10.
一种基于特征加权的蚁群聚类新算法   总被引:3,自引:1,他引:2  
蚁群聚类算法作为一种群体智能的算法已经被证实可用于高维数据的聚类,能够快速有效地处理Web的海量、高维数据,但是传统的蚁群聚类算法并未考虑各维特征的贡献率,聚类的准确度有限。文中以优化聚类效果为目标,提出了一种基于特征加权的蚁群聚类新算法FWACCA,在新算法中考虑了各维特征对分类贡献的多少,合理地使用了Sigmoid概率转换函数和主客观结合的赋权法。实验结果表明此新算法可以有效减少聚类出错率,提高聚类的准确性。  相似文献   

11.
基于群体智能与K-均值相结合的关键帧提取*   总被引:2,自引:1,他引:1  
为了从不同类型的视频中有效地提取关键帧,提出基于群体智能与K-均值相结合的关键帧提取方法。该方法首先提取视频的颜色特征向量,利用基于群体智能的聚类方法自组织地对颜色向量进行聚类,得到初始聚类;然后通过K-均值对初始聚类进行优化并加快算法收敛,得到最终聚类;最后,提取每类中距离聚类中心最近的向量对应帧并将其作为关键帧。实验表明,该算法能有效地提取出代表视频内容的关键帧,对镜头的相似性和连续性反映准确。  相似文献   

12.
离群数据挖掘是数据挖掘的重要任务之一。首先分析了离群数据及其挖掘方法,然后根据LF算法和CSI算法,提出了基于群体智能的离群数据挖掘算法,并进行了仿真实验。实验结果显示了基于群体智能的离群数据挖掘算法的有效性。与其它方法相比,该算法避免了用户在设定参数初始值时给算法带来的影响,并且不需要设定初始聚类中心,因此具有更好的鲁棒性。  相似文献   

13.
一种用于网络入侵检测的杂交聚类算法研究   总被引:6,自引:0,他引:6       下载免费PDF全文
针对K均值聚类算法在全局优化中的不足,提出了基于粒子群的K均值(PSO-KM)聚类算法。粒子群优化算法作为一种基于群智能方法的演化计算技术,有很好的全局搜索能力。通过理论分析及实验证明,该算法有较好的全局收敛性,能有效地克服传统的K均值算法易陷入局部极小值的缺点。对KDD-99数据集的仿真实验结果表明,该算法在入侵检测中能获得令人满意的检测率和误检率。  相似文献   

14.
基于无线传感器网络的移动机器人智能导航算法   总被引:1,自引:0,他引:1  
结合了无线传感器技术和群集智能技术两者的优势,提出一种新的基于无线传感器网络的移动机器人智能导航控制算法,并考虑了能量消耗的问题。算法利用基于多传感器信息融合的全局概率地图构建技术、使用群集仿生智能的基于微粒群算法的实时在线路径规划以及避障策略,提高了智能导航的整体性能,满足了在复杂环境和未知障碍物下导航的实时要求。最后设计并构造出了实际的无线传感器网络和实际的机器人系统,验证了算法成功实现机器人导航的有效性和准确性。  相似文献   

15.
萤火虫算法FA是受自然界中萤火虫的发光特性以及通过发光交流信息的现象启发提出的一种新的群智能优化算法。在该算法中,萤火虫被吸引向亮度高的萤火虫移动,最亮的萤火虫随机移动,导致该算法聚类时存在收敛速度较慢、后期容易在最优值附近振荡、稳定性较差的问题。据此,对萤火虫的移动方式和随机扰动方式做了改进,提出了一种改进的萤火虫聚类算法——基于最优类中心扰动的萤火虫聚类算法。实验比较了步长因子的取值。UCI数据集的仿真结果表明,该聚类算法的聚类效果较好,能消除FA在最优值附近反复振荡的问题,算法的稳定性和收敛性明显提高。  相似文献   

16.
一种新的基于粒子群和模拟退火的聚类算法   总被引:3,自引:0,他引:3       下载免费PDF全文
提出了一种新的基于粒子群和模拟退火的聚类算法。每个粒子作为聚类问题的一个可行解组成粒子群,粒子的位置由聚类中心向量表示。为避免粒子群陷入局部最优解,结合聚类问题的实际特点,提出了利用模拟退火的概率突跳性的两个解决方案。实验结果表明,新算法增强了全空间的搜索能力,性能优于粒子群算法和传统的K-means算法,具有较好的收敛性,是一种有效的聚类算法。  相似文献   

17.
在传统群智能算法框架的基础上,提出基于语义关系算子的群智能算法。与传统的群智能算法不同,该算法采用了一个语义关系算子进行关键参数的更新操作,并基于群体的历史状态对语义关系可进行更新。在语义关系库更新过程中,通过分析群体之前的历史状态信息,进行基于本体的语义关系挖掘,从而找到全局语义关系。以粒子群算法解组合优化问题为例,提出了基于语义关系算子的蚁群算法和粒子群算法。实验表明,基于该算子的群智能算法寻优能力有了一定程度的改进。  相似文献   

18.
基于群智能的图像分割技术因其与人类视觉机理相符合,受到人们重视。但是,现有群体模型存在的对参数取值敏感和易收敛于局部极值等问题,制约了群智能技术在复杂图像分割中的应用。首先定义了基于群智能图像分割的抽象模型,然后将通用量子粒子模型GQPM引进图像分割,提出了混合量子粒子群图像分割算法IS-MQPS。IS-MQPS算法以量子粒子携带灰度和坐标信息,以纠缠量子态定义群体行为规则,以混合量子粒子群的自组织聚类实现图像分割。实验表明,IS-MQPS算法具有对噪声不敏感、分割区域意义明确等优点,可应用于复杂图像分割。  相似文献   

19.
改进的人工鱼群算法及其在无线定位中的应用*   总被引:1,自引:1,他引:0  
摘 要:人工鱼群算法是一种基于动物行为的群体智能优化算法。针对基本鱼群算法收敛速度慢和在算法运行后期搜索盲目性较大等问题,给出了一种改进的鱼群算法。该算法采用可变视野,在搜索的后期使用随机步长,并给出了局部最优人工鱼移动策略,较好地平衡了全局搜索能力和局部搜索能力;在假设目标函数分布未知的情况下,规范了人工鱼的各种行为,给出了明确的收敛条件。在文章最后,结合蜂窝网中以功率值作为测量参数的无线定位问题,给出一种基于人工鱼群算法的分布式定位方法。仿真实验表明,该方法实现简单,全局搜索能力强,满足了定位的有效性和实时性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号