首页 | 官方网站   微博 | 高级检索  
     

基于CSS选择器的HTML信息抽取研究
引用本文:刘全志,于治楼.基于CSS选择器的HTML信息抽取研究[J].信息技术与信息化,2015(3):100-102.
作者姓名:刘全志  于治楼
作者单位:山东师范大学;浪潮集团有限公司
摘    要:基于网页结构特征的信息抽取是现阶段最为常用的抽取手段。为了将待抽取的信息从DOM树中准确地抽取出来,需要对欲抽取的信息进行准确地定位。本文提出了一种新的定位方法,在HTML DOM树的基础上,借助于CSS选择器,抽取所需要的信息。

关 键 词:DOM树  HTML信息抽取  CSS选择器

HTML Information Extraction Based On CSS Selectors
LIU Quan-zhi;YU Zhi-lou.HTML Information Extraction Based On CSS Selectors[J].Information Technology & Informatization,2015(3):100-102.
Authors:LIU Quan-zhi;YU Zhi-lou
Affiliation:LIU Quan-zhi;YU Zhi-lou;
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号