首页 | 官方网站   微博 | 高级检索  
     

一种新的WEB社群挖掘方法
引用本文:王勇,李战怀,张阳.一种新的WEB社群挖掘方法[J].计算机工程与应用,2005,41(23):159-161.
作者姓名:王勇  李战怀  张阳
作者单位:西北工业大学计算机软件与科学系,西安,710072
摘    要:随着互联网信息的增长,WEB挖掘已经成为数据挖掘研究的热点之一。论文关注于WEB社群挖掘。WEB社群是由对于同一主题感兴趣的人或组织创作的WEB页的集合。传统的挖掘方法由于只利用超链信息,所得出的社群或者太小、或者太大而没有意义。论文结合WEB页的内容信息和超链信息给出了一种基于分类方法的WEB社群挖掘算法。在包含8282个网页的WEBKB数据集上进行了实验,实验结果表明,该文算法可以挖掘出较大而且有意义的社群。

关 键 词:WEB挖掘  WEB社群  二部图
文章编号:1002-8331-(2005)23-0159-03
收稿时间:2004年11月
修稿时间:2004年11月

A New Approach for Mining Web Community
Wang Yong,Li Zhanhuai,Zhang Yang.A New Approach for Mining Web Community[J].Computer Engineering and Applications,2005,41(23):159-161.
Authors:Wang Yong  Li Zhanhuai  Zhang Yang
Abstract:With the increasing of information on Internet,WEB mining has become the focus of data mining.This paper investigates the problem of mining WEB community.A WEB community is a set of WEB page which is created by some people or organizations,which concern the same topic.Traditionally,WEB community is mined out only by hyper-link analysis.However,the WEB communities mined in this way are too small,or are not meaningful.This paper presents a novel algorithm,which takes advantage of both hyper-link and text in the WEB pages,to mine WEB community by SVM classification.The paper reports the experimental result conducted on WEBKB data collection,which contains 8 282 WEB pages.The result demonstrates that the proposed approach can mine out big meaningful communities.
Keywords:WEB mining  WEB community  bipartite graph
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号