首页 | 官方网站   微博 | 高级检索  
     

双层聚类模型在日志数据分析中的应用
引用本文:古恒,陈钊,王枞,张思悦,傅群超.双层聚类模型在日志数据分析中的应用[J].北京邮电大学学报,2015(z1):63-66,71.
作者姓名:古恒  陈钊  王枞  张思悦  傅群超
作者单位:北京邮电大学 计算机学院,北京100876;北京邮电大学 可信分布式计算与服务教育部重点实验室,北京100876;北京市政务信息安全应急处置中心,北京,100101;北京邮电大学 可信分布式计算与服务教育部重点实验室,北京100876;北京邮电大学 软件学院,北京100876
摘    要:提出了一种基于自组织特征映射( SOM)神经网络和模糊c-均值( FCM)的双层聚类方法,对Web日志中的日志数据集进行聚类。第一层是无监督SOM神经网络聚类方法,它所产生的类的个数大大减少了原始数据集的个数,降低了FCM对类初始中心点的依赖;然后利用FCM聚类算法的优势对第一层中产生的类的中心点进行聚类,从而大大减少了聚类的时间复杂度;最后通过平行坐标技术可视化展示聚类前后的日志数据集,方便对日志数据进行分析。

关 键 词:平行坐标  日志数据  聚类  自组织特征映射  模糊c-均值

The Application of Double Layer Clustering Model on Log Data Analysis
GU Heng,CHEN Zhao,WANG Cong,ZHANG Si-yue,FU Qun-chao.The Application of Double Layer Clustering Model on Log Data Analysis[J].Journal of Beijing University of Posts and Telecommunications,2015(z1):63-66,71.
Authors:GU Heng  CHEN Zhao  WANG Cong  ZHANG Si-yue  FU Qun-chao
Abstract:A double clustering model to make web log data sets clustering was proposed based on the self-organizing map ( SOM) neural networks and the fuzzy c-means ( FCM) method. The first tier uses unsu-pervised clustering method—SOM neural network, so the number of classes it generates significantly re-duces compared with the original data set, it also reduces the FCM method' s rely on class initial centers. Using the FCM clustering algorithm to cluster the center points of classes generated by the first layer, the time complexity of clustering is greatly reduced. Meanwhile, the parallel coordinates visualization tech-nology to demonstrate the log dataset was used, it is suitable to analyze the log data.
Keywords:parallel coordinates  log data  cluster  self-organizing map  fuzzy c-means
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号