首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
雷景生  伍庆清  王平 《计算机工程》2005,31(1):12-13,16
针对Web文档的特点,提出了一种多层向量空间模型,用来确定Web文档特征词的权重,然后给出了一种基于混合神经网络的文档聚类算法。实验结果表明,所提出的Web文档聚类算法具有较好的聚类特性,它能将与一个主题相关的Web文档较完全和准确地聚成一类。  相似文献   

2.
基于群体智能理论的聚类模型及优化算法   总被引:8,自引:0,他引:8  
聚类是一种把整个数据库分成不同的群组,使群与群之间差别很明显,而同一个群之间的数据尽量相似的算法。该文通过对现有群体智能理论和聚类算法的研究,提出了一种基于群体智能理论的聚类模型,并在此基础上给出了一种优化蚁群聚类算法。实验证明,该优化蚁群算法具有良好的聚类效果,可应用于经济分析、模式识别、文档归类等多个领域。  相似文献   

3.
将群体智能技术应用于半结构化的藏文Web文本聚类,提出基于群体智能的半结构化藏文Web文本聚类算法(SCAST).充分考虑群体智能技术对藏文文本聚类准确性和时间效率的影响,SCAST算法首先运用向量空间模型表示藏文文本信息,将藏文文本和智能蚁群随机放置于一个文本向量空间中.然后智能蚂蚁随机选择藏文文本,计算藏文文本在当前局部区域内的相似性,获得拾起或者放下文本的概率,进而决定是否"拾起","移动","放下"藏文文本.最后通过多次迭代训练,将藏文文本按其相似性聚集在一起,得到最终聚类结果.大量真实藏文Web文本数据上的实验结果表明,相较于传统的k-means聚类算法,基于群体智能的藏文文本聚类算法在聚类准确率上平均提高约8.0%.  相似文献   

4.
基于分级神经网络的Web文档模糊聚类技术   总被引:1,自引:1,他引:1  
给出了一种多层向量空间模型,该模型将一篇文档的相关信息从逻辑上划分为多个相对独立的文本段,按照不同位置的文本段确定相应的索引项权重.然后提出了一种简明而有效的基于分级神经网络的模糊聚类算法.与现有方法不同,该模糊聚类方法采用自组织神经网络和模糊聚类网络两部分组成的3层神经网络来实现.首先采用自组织神经网络从原始数据产生一个初始聚类结果,然后运用FCM方法对初始聚类的数目进行优化.实验结果表明,提出的Web文档聚类算法具有较好的聚类特性,它能将与一个主题相关的web文档较完全和准确地聚成一类.  相似文献   

5.
李昕  钱旭  王自强 《计算机工程》2010,36(15):40-42,48
为有效解决文档聚类问题,提出一种基于间隔流形学习的文档聚类算法。该算法利用间隔Fisher分析将高维文档空间降维到低维特征空间,利用支持向量聚类算法进行聚类。在基准文档测试集上的实验结果表明,该算法的聚类性能优于其他常用的文档聚类算法。  相似文献   

6.
一种基于群体智能的客户行为分析算法   总被引:33,自引:0,他引:33  
提出了一种基于群体智能的客户行为分析算法.首先将客户的消费模式作为平面上的一个点随机分布于平面区域内;然后依据基于群体智能的聚类方法,选用由小到大的群体相似系数进行聚类分析;最后,在平面区域内采用递归算法收集聚类结果,获得不同消费特征的客户群体.文中还提出了算法的并行策略,提高了算法对大数据量的适应性.该文以电信移动客户话费数据作为实验数据,并将算法结果与其它经典聚类算法的结果进行比较分析.分析结果表明:这种基于群体智能的客户行为分析算法能够满足客户聚类和分类的要求,特别是在大客户分析及一对一营销中特别客户的分析方面该算法有直观、类别特征明显等特点.  相似文献   

7.
随着信息的爆炸式增长,现有的搜索引擎在很多方面不能满足人们的需要。Web文档聚类可以减小搜索空间,加快检索速度,提高查询精度。提出了一种融合SOM(Self-Organizing Maps)粗聚类和改进PSO(Particle Swarm Optimization)细聚类的Web文档集成聚类算法。首先根据向量空间模型表示法,用特征词条及其权值表示Web文档信息,其次用SOM算法对文档特征集进行粗聚类,得到一组输出权值,然后用这组权值初始化改进的PSO算法,用改进PSO算法对此聚类结果进行细化,最终实现Web文档聚类。仿真结果表明,该算法能有效提高文档查询的查准率和查全率,具有一定的实用价值。  相似文献   

8.
Web文档聚类是web数据挖掘的重要任务之一,针对Web文档向量空间的高维性与数据聚类问题的最优化性质,采用LDA对文档向量空间进行降维,提出运用混合优化算法GA_PSO在此低维空间进行寻优,来发现Web文档集的最优簇结构.通过在真实数据集20Newsgroups的实验,结果表明我们的方法具有良好的聚类有效性,能较完全和准确地将主题相关的Web文档聚成一类.  相似文献   

9.
一种基于容错粗糙集的Web搜索结果聚类方法   总被引:1,自引:0,他引:1  
一些Web聚类方法把类严格作为互斥的关系,聚类效果不理想.一种基于容错粗糙集的k均值的聚类解决了这一问题.首先运用向量模型表示Web文档信息,采用常规方法得到文本特征词集,然后利用某些特征词协同出现的价值,构造特征词客错关系,扩充特征词的描述能力,最后用特征词容错类描述文档之间的相似关系,实现了Web搜索结果聚类,并提出了简单直观的衡量聚类精度的T模型.实验结果表明,利用容错关系聚类的类标记描述性强、容易理解、明显优于普通k均值算法.  相似文献   

10.
基于向量空间的Web服务发现模糊方法   总被引:2,自引:0,他引:2  
彭敦陆  周傲英 《计算机应用》2006,26(9):2009-2012
Web服务已逐渐发展成为重要的分布式计算范式。在综合分析了现有的Web服务描述文档的基础上,提出了一种基于模糊集的服务特征项集选取算法以及Web服务向量空间的生成方法。利用生成的向量空间,对Web服务进行模糊聚类。基于此,文中给出了向量空间中进行Web服务发现的模糊方法。所提出的方法只需利用现有的Web服务描述信息,保证了服务发现的有效性。  相似文献   

11.
在遥感领域,获取用于训练的标记数据耗费巨大且困难,因此许多非监督技术逐渐被发展和应用于标记样本有限的遥感图像。将[k]均值和蜂群算法相结合,提出一种新的非监督聚类算法。使用灰度共生矩阵和小波变换提取遥感图像特征,对特征数据集进行蜂群[k]-means聚类。整个聚类过程首先使用最大最小距离积邻域均值法产生初始聚类中心,将蜂群算法和[k]-means算法交替执行,实现遥感图像的聚类。通过UCI数据集和凉水国家级自然保护区的遥感数据的实验结果表明,该算法具有较高的聚类准确率,满足遥感图像聚类的应用需求。  相似文献   

12.
离群数据挖掘是数据挖掘的重要任务之一。首先分析了离群数据及其挖掘方法,然后根据LF算法和CSI算法,提出了基于群体智能的离群数据挖掘算法,并进行了仿真实验。实验结果显示了基于群体智能的离群数据挖掘算法的有效性。与其它方法相比,该算法避免了用户在设定参数初始值时给算法带来的影响,并且不需要设定初始聚类中心,因此具有更好的鲁棒性。  相似文献   

13.
This paper presents a multi-ant colonies approach for clustering data that consists of some parallel and independent ant colonies and a queen ant agent. Each ant colony process takes different types of ants moving speed and different versions of the probability conversion function to generate various clustering results with an ant-based clustering algorithm. These results are sent to the queen ant agent and combined by a hypergraph model to calculate a new similarity matrix. The new similarity matrix is returned back to each ant colony process to re-cluster the data using the new information. Experimental evaluation shows that the average performance of the aggregated multi-ant colonies algorithms outperforms that of the single ant-based clustering algorithm and the popular K-means algorithm. The result also shows that the lowest outliers strategy for selecting the current data set has the best performance quality.  相似文献   

14.
Clustering is a popular data analysis and data mining technique. A popular technique for clustering is based on k-means such that the data is partitioned into K clusters. However, the k-means algorithm highly depends on the initial state and converges to local optimum solution. This paper presents a new hybrid evolutionary algorithm to solve nonlinear partitional clustering problem. The proposed hybrid evolutionary algorithm is the combination of FAPSO (fuzzy adaptive particle swarm optimization), ACO (ant colony optimization) and k-means algorithms, called FAPSO-ACO–K, which can find better cluster partition. The performance of the proposed algorithm is evaluated through several benchmark data sets. The simulation results show that the performance of the proposed algorithm is better than other algorithms such as PSO, ACO, simulated annealing (SA), combination of PSO and SA (PSO–SA), combination of ACO and SA (ACO–SA), combination of PSO and ACO (PSO–ACO), genetic algorithm (GA), Tabu search (TS), honey bee mating optimization (HBMO) and k-means for partitional clustering problem.  相似文献   

15.
为解决语义特征化后复杂造型协同设计中造型共享库中的造型检索问题,提出了一种基于群智能自组织聚类算法。该算法首先将语义特征造型信息向量化,通过语义造型特征树得到语义特征造型特征集,以蚁群算法做为自组织准则,并以粒子群算法做为蚁群移动模型,将特征语义群分布在一个平面上进行聚类,递归收集聚类结果。试验证明,采用此种方法,可以对特征造型完成准确率很高的聚类,使特征库组织性得到了很大提高。  相似文献   

16.
群体智能优化算法利用群体的优势,在没有集中控制并且不提供全局模型的前提下,为寻找复杂的分布式问题的解决方案提供了基础。介绍了两种群体智能算法模型:蚁群算法模型和粒子群算法模型,研究了两种算法的原理机制、基本模型、流程实现、改进思想和方法;通过仿真把蚁群算法与其他启发式算法的计算结果作对比,验证了蚁群算法具有很强的发现较好解的能力,不容易陷入局部最优;微粒群算法保留了基于种群的、并行的全局搜索策略,采用简单的速度-位移模型操作,在实际应用中取得了较高的成功率。  相似文献   

17.
针对模糊文本聚类算法(FCM)对输入顺序以及初始点敏感的问题,提出了一种使用蚁群优化的模糊聚类算法(FACA)。该算法采用蚁群聚类算法(ACA)找到聚类的初始中心点,以解决模糊聚类的输入顺序以及初始点敏感等问题。模糊文本聚类算法的线性复杂度使其更便于在计算机实现。与经典的基本模糊聚类以及蚁群聚类在真实数据集上仿真相比较,结果表明经蚁群优化过的模糊聚类算法(FACA)效果更有效,更适合应用于大型的数据集。  相似文献   

18.
群智能是一种仿生自然界动物昆虫觅食筑巢行为的新兴演化计算技术。目前主要的群智能优化算法有蚁群算法、微粒群算法和人工鱼群算法。本文介绍了群智能算法的产生、发展和优点,并着力阐述了上述三种典型算法的基本原理,同时概述了各算法的应用现状,最后提出了算法将来有待研究的内容。  相似文献   

19.
模糊C均值(FCM)聚类算法采取随机选取聚类中心的方法,这种方法使得FCM算法在局部范围内容易获得最优解,但在全局范围内效果较差,且FCM算法中聚类簇的个数一般需要人为设定。面对上述种种问题,文中将蚁群聚类算法和FCM聚类算法进行结合,获得了一种改进的FCM聚类算法。该算法在初步聚类中利用蚁群聚类产生聚类中心和簇的个数,将产生的聚类中心提供给FCM算法进行再次聚类。利用蚁群聚类的全局搜索和并行运算的优点避免了聚类易陷入局部最优解的缺陷。经过实验验证,该算法较一般FCM算法具有更好的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号