首页 | 官方网站   微博 | 高级检索  
     

Web数据抽取技术研究进展
引用本文:张成洪,古晓洪,白延红.Web数据抽取技术研究进展[J].计算机科学,2004,31(2):129-131.
作者姓名:张成洪  古晓洪  白延红
作者单位:复旦大学管理学院,上海200433
摘    要:由于Web上存在着大量有用而复杂的信息,近年来学术界和企业界开发了许多从Web中抽取数据的方法和工具。本文总结了Web数据抽取技术的研究进展和从Web中抽取数据的主要原理、过程、方法和抽取规则,并讨论了未来的研究方向。

关 键 词:Web  网页  数据抽取  分布式数据库系统  数据模型  数据管理

The Progress of Web Data Extraction Technology
ZHANG Cheng-Hong GU Xiao-Hong BAI Yan-Hong.The Progress of Web Data Extraction Technology[J].Computer Science,2004,31(2):129-131.
Authors:ZHANG Cheng-Hong GU Xiao-Hong BAI Yan-Hong
Abstract:In order to extract data from the Web,a great number of approaches and tools have been developed by academic community and commercial companies. This article gives an overview of the progress of Web data extraction technology and outlines the main principles .processes .approaches and extraction rules to extract data from the Web. It also points out the direction for the research in the future.
Keywords:Web data extraction  Web query  Wrapper  Extraction rules  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号