首页 | 官方网站   微博 | 高级检索  
     

支持Web信息分类的高性能蜘蛛程序
引用本文:高克宁,柴桥子,张斌,马安香.支持Web信息分类的高性能蜘蛛程序[J].小型微型计算机系统,2006,27(7):1308-1312.
作者姓名:高克宁  柴桥子  张斌  马安香
作者单位:东北大学,信息学院,计算机应用技术研究所,辽宁,沈阳,110004
摘    要:随着Web信息的快速增长,如何提高信息检索的准确率,如何展示检索结果,成为Web信息检索的重点研究内容,本文设计一种新的蜘蛛程序T—Spider,采用分布式两级并行控制,在获取Web信息的同时,获取网站结构,从而支持基于网站结构的信息分类.

关 键 词:蜘蛛程序  信息分类  网站结构  分布式
文章编号:1000-1220(2006)07-1308-05
收稿时间:03 31 2005 12:00AM
修稿时间:2005-03-31

High Performance T-Spider of Supporting Web Information Classification
GAO Ke-ning,CHAI Qiao-zi,ZHANG Bin,MA An-xiang.High Performance T-Spider of Supporting Web Information Classification[J].Mini-micro Systems,2006,27(7):1308-1312.
Authors:GAO Ke-ning  CHAI Qiao-zi  ZHANG Bin  MA An-xiang
Affiliation:Information Science and Engineering, College of Northeastern University, Institute of Computer Application Techniques, Shenyang 110004, China
Abstract:As Web information grows quickly, how to improve accuracy of information retrieval and how to organize searching result set has being a research focus of Web information retrieval. This paper proposed a new spider called T-spider, which was consisted of two levels parallelization control, so to obtain Website structure when downloading info pages, and to support site structure based classification.
Keywords:spider  information classification  website structure  distribution
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号