首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
针对K均值算法存在的初始聚类中心敏感和易陷入局部最优等缺陷,利用人工鱼群算法全局寻优能力,提出一种人工鱼群和K均值算法相融合的网络入侵检测模型(AFSA-KCM).首先采用抽样技术和最大最小距离算法获得一组较优的聚类中心和聚类数目,然后通过人工鱼群模拟自然界鱼群的觅食、聚群,追尾等行为,找到最优的聚类中心和聚类数目,最后利用K均值算法根据最优的聚类中心和聚类数目建立最优的入侵检测模型,并采用KDD CUP99数据集进行测试实验.实验结果表明,相对于其它入侵检测模型,AFSA-KCM不仅提高了网络入侵检测率,同时加快了网络入侵检测速度,可以为网络安全入侵检测提供有效保证.  相似文献   

2.
聚类分析就是按照数据间的相似程度,依据特定的准则将数据划分成不同种类.目前聚类分析算法普遍存在对初始参数敏感,难以找到最优聚类以及聚类有效性等问题.人工鱼群算法作为一种新型仿生优化算法,具有良好的克服局部极值和获得全局极值的能力.引入聚类数学模型,结合现有人工鱼群算法的特点和聚类算法理论,通过模拟鱼群的智能行为进行聚类分析,提出了一种基于人工鱼群算法的聚类挖掘方法.对空间数据的实验和蚁群算法的对比研究表明,该算法具有良好的聚类效果.  相似文献   

3.
一种新的混合聚类分析算法*   总被引:2,自引:1,他引:1  
结合人工鱼群算法的全局寻优优点提出了一种基于人工鱼群算法的K-平均混合聚类分析算法。实验结果表明,该算法能克服K-平均聚类算法易陷入局部极小的不足,有较好的全局性,且聚类正确率明显高于K-平均算法,聚类效果更好。  相似文献   

4.
《软件工程师》2019,(6):33-37
针对基于传统模糊C均值聚类的网络入侵检测模型存在分类效果不佳,且容易出现局部极值的问题,提出了一种基于量子人工鱼群的半监督模糊核聚类算法。该算法使用少量的标记数据和大量未知标记数据生成网络入侵检的分类,并通过核距离的方式构建了模糊C均值聚类算法的新目标函数,此外,结合了量子人工鱼群算法来解决模糊核聚类算法的全局最优解问题,适用于并行执行架构。在KDD Cup 99网络入侵检测数据上的仿真实验结果表明,相比于基于FCM和PSO-FCM的入侵检测模型,以及基于此提出的算法入侵检测模型具有更好的检测率。  相似文献   

5.
基于人工鱼群的优化K-means聚类算法   总被引:3,自引:2,他引:1  
针对K-means算法全局搜索能力不足,提出基于人工鱼群的优化K-means聚类算法(AFS-KM),该算法克服了Kmeans聚类算法对初始聚类中心选择的敏感问题,能够获得全局最优的聚类划分。在聚类过程中,采用一种基于信息增益的属性加权的实体之间距离计算方法进行聚类划分时,对于球形数据和椭球形数据都能够获得理想的聚类划分结果。对KDD-99数据集的仿真实验结果表明,该算法在网络入侵检测时获得了理想的检测率和误报率。  相似文献   

6.
王培崇  钱旭  雷凤君 《计算机应用》2012,32(8):2189-2192
针对K-Means算法对于初始k值较敏感和容易过早收敛的问题,提出基于人工鱼群机制的K-Means聚类算法(NAFS)。首先,利用先验知识随机产生待求解问题的若干个聚类中心,组成一个鱼群环境;其次,利用鱼群个体的协作、竞争机制寻找满意的结果。鉴于人工鱼群算法后期容易陷入局部最优,根据鱼群聚集度引入小生境算法,改善种群的多样性,提高了算法的求解精度。在KDDCUP99数据集上的实验结果表明,该算法具有较高的聚类精度,适用于高维数据的聚类问题。  相似文献   

7.
提出一种基于K-Means聚类的人工鱼群算法, 该算法利用人工鱼群算法鲁棒性较强且不易陷入局部最优值的特点, 动态的确定了聚类的数目和中心, 解决了K-Means聚类初始点选择不稳定的缺陷, 在此两种算法融合的基础上进行图像分割处理, 经试验证明该算法效果理想.  相似文献   

8.
针对K-means易收敛于局部最优以及对初始值敏感和人工鱼群算法收敛速度快,对初始值不敏感及自组织行为的问题,提出一种K-means和人工鱼群算法融合的聚类方法。该算法先将标准人工鱼群算法用自适应策略加以改进,即在人工鱼群算法早期迭代中使用固定视野,随着迭代次数的增加,采用自适应减少的视野值。在此基础上将K-means算法融入到改进的人工鱼群算法中人工鱼中,随机产生的部分人工鱼在每次完成人工鱼群算法的迭代后,进行一次K-means算法的迭代。实验结果证明融合后的新算法明显地优于粒子群优化(PSO)、K-means及改进的人工鱼群算法(IAFSA),它将有效地被应用于数据聚类中。  相似文献   

9.
传统的K-均值聚类方法,在聚类过程中过度依赖初始聚类中心的选择,同时由于全局搜索能力的不足,很难得到精确的聚类中心。鱼群算法在解决优化问题中表现出良好的并行性和全局搜索特性,但由于人为设置参数的影响可能会陷入局部最优。针对聚类问题的特征,将鱼群算法运用到聚类问题中,在使用自适应步长的鱼群算法的基础上,进一步融合免疫接种机制,加强算法对精确解的搜索性能,通过UCI数据集上的实验分析和比较,表明算法具有更好的有效性和稳定性。  相似文献   

10.
基于人工鱼群算法的协同过滤推荐算法   总被引:1,自引:0,他引:1  
基于原始人工鱼群算法,提出在觅食行为中保留较优值以替代随机值,在追尾和聚群行为中比较最优值和中心值再作移动行为的选择,在迭代进行中,实现视野的自适应调整.这样改进后的人工鱼群算法应用于协同过滤推荐系统中,实现用户聚类,从而提高协同过滤推荐系统的最近邻查询速度,降低搜索开销.实验测试结果显示了改进的人工鱼群算法具有收敛速度快,稳定性高的特性,且能获得较优的聚类目标值.将改进的人工鱼群算法用于协同过滤推荐算法中,提高了算法的推荐精度.  相似文献   

11.
针对快速发现用户适合度较高的Web服务问题,提出了一种基于用户情境聚类的Web服务发现方法.将聚类与倒排索引技术融入Web服务发现算法,利用BIRCH聚类思想进行用户情境聚类,有效地缩小了Web服务的查找范围,而倒排索引技术则能够快速定位服务,进一步优化了Web服务发现的时间.结合实例和实验,并与其他Web服务发现方法进行比较,结果表明了该方法的服务发现结果和时间效率均优于其他方法.  相似文献   

12.
互联网技术的发展日新月异,Web数据是海量的,同时网络用户的浏览兴趣也是不断变换的。为了满足用户兴趣不断变换的需求,更好地实现个性化推荐,提出了一种新的Web用户会话实时聚类算法。算法分析验证了该算法可以提高聚类速度,能更好地满足用户的需求。  相似文献   

13.
在Web数据挖掘研究领域中,Web日志挖掘是Web数据研究领域中一个最重要的应用方面。本文对Web日志挖掘作了系统的研究。包括对服务器上日志结构的分析和对数据预处理过程的描述。文中着重讨论了用户模糊聚类的算法,并用实例证明了模糊聚类在web用户聚类应用中的可行性。在此基础上还提出了一个Web站点的个性化服务模型,通过对Web服务器中日志的挖掘,发现具有相似访问兴趣的用户群,进而为用户作个性化的推荐。  相似文献   

14.
在Web数据挖掘研究领域中,Web日志挖掘是Web数据研究领域中一个最重要的应用方面。本文对Web日志挖掘作了系统的研究,包括对服务器上日志结构的分析和对数据预处理过程的描述。文中着重讨论了用户模糊聚类的算法,并用实例证明了模糊聚类在Web用户聚类应用中的可行性。在此基础上还提出了一个Web站点的个性化服务模型,通过对Web服务器中日志的挖掘,发现具有相似访问兴趣的用户群,进而为用户作个性化的推荐。  相似文献   

15.
提出一种基于本体的网络会话表示方法,即语义会话,和一种会话聚类和可视化方法。会话聚类方面基于用户浏览网站的公共路径提出一种语义会话间的相似性度量——语义公共路径相似性度量(SMSCP),并且使用改进的kmedoids聚类算法衡量其有效性。在聚类结果可视化方面应用层云表来展示聚类结果。实验表明文中的聚类方法和可视化方法具有更好的有效性及可理解性。  相似文献   

16.
用户对Web网站访问兴趣可以通过页面的浏览顺序表现出来,Web站点的访问日志记录了用户访问页面的详细信息.介绍Web站点访问日志挖掘的相关知识,并定义新的兴趣度,相似度和聚类中心,提出了一种基于用户访问兴趣的路径聚类算法,最后通过实验来验证这种算法的有效性.  相似文献   

17.
对 Web 页面和用户的聚类算法提出了一种CAFM聚类算法.在该算法中,把模糊多重集的概念引入到模糊聚类算法中,将反映用户浏览行为的页面点击次数、停留时间、用户偏好等因素用模糊多重集来综合刻画用户访问站点的兴趣度,再以此来建立模糊多重相似矩阵直接进行聚类.通过实例说明了算法的具体计算过程和可行性.  相似文献   

18.
模糊聚类算法是一种有效的聚类手段,介绍了最大树模糊聚类算法。在商务网站中,以Web日志中数据为依据,基于访问模式对商品及用户进行模糊聚类处理,给出算法实现的步骤,讨论了实现的关键技术,并介绍了未来工作的发展方向。  相似文献   

19.
Interval Set Clustering of Web Users with Rough K-Means   总被引:1,自引:0,他引:1  
Data collection and analysis in web mining faces certain unique challenges. Due to a variety of reasons inherent in web browsing and web logging, the likelihood of bad or incomplete data is higher than conventional applications. The analytical techniques in web mining need to accommodate such data. Fuzzy and rough sets provide the ability to deal with incomplete and approximate information. Fuzzy set theory has been shown to be useful in three important aspects of web and data mining, namely clustering, association, and sequential analysis. There is increasing interest in research on clustering based on rough set theory. Clustering is an important part of web mining that involves finding natural groupings of web resources or web users. Researchers have pointed out some important differences between clustering in conventional applications and clustering in web mining. For example, the clusters and associations in web mining do not necessarily have crisp boundaries. As a result, researchers have studied the possibility of using fuzzy sets in web mining clustering applications. Recent attempts have used genetic algorithms based on rough set theory for clustering. However, the genetic algorithms based clustering may not be able to handle the large amount of data typical in a web mining application. This paper proposes a variation of the K-means clustering algorithm based on properties of rough sets. The proposed algorithm represents clusters as interval or rough sets. The paper also describes the design of an experiment including data collection and the clustering process. The experiment is used to create interval set representations of clusters of web visitors.  相似文献   

20.
结合Web用户访问特点,针对Web用户访问路径聚类分析中普遍存在的对象类别不确定性现象进行了研究.结合模糊聚类和可能性聚类的特点,提出来一种新的用户访问路径的可能性模糊聚类算法.新方法通过定义相关的截集,自动地将对象分配到若干簇中,避免了人工干预,实现了交叉聚类的目的.新方法建立在leader聚类算法的框架上,只需要扫描数据集一遍使得算法效率大大提高.在标准数据集上的对比试验表明新算法不仅是有效的,而且效率较高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号