首页 | 官方网站   微博 | 高级检索  
     

基于网页标题的主题相关度算法的研究
引用本文:赵德平,蔡立静,李鹏,刘阳. 基于网页标题的主题相关度算法的研究[J]. 计算机光盘软件与应用, 2010, 0(16)
作者姓名:赵德平  蔡立静  李鹏  刘阳
摘    要:首先,给出了主题爬虫的概念;然后介绍了主题相关度计算的两种模型;布尔模型和空间向量模型;通过对两种模型进行分析,提出了一种基于网页标题的空间向量模型主题相关度计算方法Relative.经过试验分析,该算法具有很好的实用性,基于该算法的主题爬虫系统能够在Web上爬取高度主题相关的网页,极大的提高了网络爬虫的效率.

关 键 词:空间向量模型  网页标题  主题相关度  布尔模型  主题爬虫

Rearch on the Topic Correlation Algorithm based on Page Title
Zhao Deping,Cai Lijing,Li Peng,Liu Yang. Rearch on the Topic Correlation Algorithm based on Page Title[J]. , 2010, 0(16)
Authors:Zhao Deping  Cai Lijing  Li Peng  Liu Yang
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号