首页 | 官方网站   微博 | 高级检索  
     

基于DOM的Web信息抽取方法
引用本文:邓箴. 基于DOM的Web信息抽取方法[J]. 计算机光盘软件与应用, 2010, 0(10): 18-18
作者姓名:邓箴
作者单位:宁夏大学,银川,750021
摘    要:传统基于DOM的信息抽取方法采用路径作为抽取规则,由于规则过于单一,因此效果并不十分理想。本文从相似页面的获取出发,逐步介绍了基于DOM采用特征比较法进行信息抽取的过程,最后还给出了针对多记录网页抽取时的试探策略、实验证明,该方法可以有效地抽取出网页中的数据。

关 键 词:DOM  信息抽取:相似页面

DOM-based Web Information Extraction
Deng Zhen. DOM-based Web Information Extraction[J]. , 2010, 0(10): 18-18
Authors:Deng Zhen
Abstract:
Keywords:DOM
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号