首页 | 官方网站   微博 | 高级检索  
     

对Web页面内容挖掘中数据提取问题的研究
引用本文:杨彪,罗时朋,孟波.对Web页面内容挖掘中数据提取问题的研究[J].微型机与应用,2002,21(1).
作者姓名:杨彪  罗时朋  孟波
作者单位:武汉大学计算机系 430072(杨彪,罗时朋 ),武汉华中科技大学水电与数字化工程学院 430074(孟波)
摘    要:随着Internet的飞速发展及Web在全球的进一步普及,WWW上的信息量呈指数级增长。面对这一情形,研究人员开始将数据挖掘技术用于Web,从而产生了一个新的研究方向——Web挖掘。Web挖掘即是对Web文档的内容、可利用的Web资源的使用情况以及Web资源间的关系进行分析。本文分析了Web页面的半结构化特点,介绍了国内外学者针对Web页面的半结构化特点提出的用于从Web页面中提取数据的构建包装器方法。在Web数据提取领域,包装器一般就是一个从Web页面中提取数据的程序。同时介绍了作者本人的一些工作,包括一个新闻下载浏览模块和一个信息…

本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号