首页 | 官方网站   微博 | 高级检索  
     

基于CSS选择器的深网结果页抽取方法
引用本文:陶磊,莫倩.基于CSS选择器的深网结果页抽取方法[J].北京工商大学学报(自然科学版),2009,27(2).
作者姓名:陶磊  莫倩
作者单位:北京工商大学,计算机与信息工程学院,北京,100048
基金项目:北京市科委新星计划,北京优秀人才计划项目 
摘    要:提出一种基于CSS选择器的深网结果页数据抽取方法,用于抽取深网结果页中的数据记录.实验结果表明在大多数情况下,该方法都能准确抽取出页面中的数据记录.

关 键 词:深网  CSS  MDR  数据抽取

A NEW EXTRACTION METHOD IN DEEP WEB RESULT PAGES BASED ON CSS SELECTOR
TAO Lei,MO Qian.A NEW EXTRACTION METHOD IN DEEP WEB RESULT PAGES BASED ON CSS SELECTOR[J].Journal of Beijing Technology and Business University:Natural Science Edition,2009,27(2).
Authors:TAO Lei  MO Qian
Affiliation:School of Computer and Information Engineering;Beijing Technology and Business University;Beijing 100048;China
Abstract:We propose a methodology based on CSS selector to extract data records from deep web result pages.Experimental evaluation on a large number of Web page collections indicates that our methodology correctly extracts data records in most cases.
Keywords:CSS  MDR
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号