首页 | 官方网站   微博 | 高级检索  
     

搜索引擎查询日志中的聚类算法研究
引用本文:勾海波,欧阳为民,徐春荣.搜索引擎查询日志中的聚类算法研究[J].计算机应用与软件,2007,24(3):145-147.
作者姓名:勾海波  欧阳为民  徐春荣
作者单位:1. 上海大学计算机工程与科学学院,上海,200072
2. 上海大学计算机网络中心,上海,200072
摘    要:近年来,随着网络数据挖掘技术的迅猛发展,如何从搜索引擎查询日志中找到有用的信息成为一个重要的研究方向.首先详细讨论了Beeferman提出的针对搜索引擎查询日志的凝聚式聚类算法以及噪声数据对该算法的影响,指出了Chan的改进算法中的一个错误,最后提出一个新的改进算法,并且通过模拟实验对几种不同的算法进行了对比.

关 键 词:网络数据挖掘  搜索引擎查询日志  聚合式聚类  搜索引擎  查询日志  聚类算法  算法研究  QUERY  SEARCH  ENGINE  模拟实验  错误  改进算法  影响  噪声数据  方向  信息  发展  挖掘技术  网络数据
修稿时间:2004-11-30

STUDYING OF AGGLOMERATIVE CLUSTERING ALGORITHM IN SEARCH ENGINE QUERY LOG
Gou Haibo,Ouyang Weiming,Xu Chunrong.STUDYING OF AGGLOMERATIVE CLUSTERING ALGORITHM IN SEARCH ENGINE QUERY LOG[J].Computer Applications and Software,2007,24(3):145-147.
Authors:Gou Haibo  Ouyang Weiming  Xu Chunrong
Affiliation:1.School of Computer Engineering and Science,Shanghai University, Shanghai 200072, China; 2 . Campus Network Center,Shanghai University,Shanghai 200072, China
Abstract:During the recent years,with the rapid development of Web data mining, how to find useful information in search engine log query has become an important research direction. This paper discussed in detail firstly an agglomerative clustering algorithm proposed by Beeferman which is invented to do clustering work in search engine query logs and the influence caused by noisy datum ,then pointed out an error in the improved algorithm proposed by Chan, finally proposed an improved clustering algorithm and compared these algorithms through simulation.
Keywords:Web data mining Search engine query log Agglomerative clustering
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号