首页 | 官方网站   微博 | 高级检索  
     

基于层次语义的URL排序方法研究
引用本文:曾义聪,杨贯中,周志光,曾强聪.基于层次语义的URL排序方法研究[J].计算机工程与设计,2008,29(13).
作者姓名:曾义聪  杨贯中  周志光  曾强聪
作者单位:1. 长沙民政职业技术学院,电子工程系,湖南,长沙,410004
2. 湖南大学,软件学院,湖南,长沙,410082
基金项目:教育部科学技术基金 , 湖南省规划基金
摘    要:为了提高主题爬取的采集性能,提出了基于层次语义的URL排序算法.主题爬取过程中引入了层次语义的启发信息,采用层次语义组合排序度量进行URL排序,并对层次语义引导主题爬取的采集率性能进行实验研究.实验表明,采用基于层次语义的URL排序方法,爬取过程中由初始URL链接能快速导向某目标主题集的Web文档.同时,当目标主题集的邻近区域没有相关的页面时,逐步放宽主题范围,在较宽的主题区域中爬取,能较快地导向其它不相邻的主题区域.

关 键 词:采集率  层次语义  URL排序  概念树  主题爬取

Research on URL ordering method based on layer semantic
ZENG Yi-cong,YANG Guan-zhong,ZHOU Zhi-guang,ZENG Qiang-cong.Research on URL ordering method based on layer semantic[J].Computer Engineering and Design,2008,29(13).
Authors:ZENG Yi-cong  YANG Guan-zhong  ZHOU Zhi-guang  ZENG Qiang-cong
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号