首页 | 官方网站   微博 | 高级检索  
     

一种Deep Web聚焦爬虫爬行策略
引用本文:蔡欣宝,陈洪平,赵朋朋,崔志明.一种Deep Web聚焦爬虫爬行策略[J].微电子学与计算机,2009,26(8).
作者姓名:蔡欣宝  陈洪平  赵朋朋  崔志明
作者单位:1. 苏州大学,智能信息处理及应用研究所,江苏,苏州,215006
2. 苏州大学,智能信息处理及应用研究所,江苏,苏州,215006;江苏省现代企业信息化应用支撑软件工程技术研发中心,江苏,苏州,215104
基金项目:国家自然科学基金项目,2008年江苏省重大科技支撑与自主创新项目,江苏省现代企业信息化应用支撑软件工程技术研发中心开放基金项目 
摘    要:实现大规模Deep Web数据源集成是方便用户使用Deep Web信息的一种有效途径,Deep Web爬虫是Deep Web数据源集成的关键组成部分,提出一种针对结构化Deep Web的聚焦爬虫爬行策略,通过对查询接口的特征分析来判断Deep Web数据源的主题相关性,同时,在评价链接重要性时,综合考虑了页面内容的主题相关性和链接的相关信息,实验证明该方法是有效的.

关 键 词:结构化Deep  Web数据源  聚焦爬虫  决策树分类器

A Deep Web Sources Focused Crawler's Crawling Strategy
CAI Xin-bao,CHEN Hong-ping,ZHAO Peng-peng,CUI Zhi-ming.A Deep Web Sources Focused Crawler's Crawling Strategy[J].Microelectronics & Computer,2009,26(8).
Authors:CAI Xin-bao  CHEN Hong-ping  ZHAO Peng-peng  CUI Zhi-ming
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号